صفحه 1:
واژگان بیرون از واژهنامه
خرداد 87
صفحه 2:
واژگان بیرون از واژهنامه
تشخیص واژگان بیرون از واژهنامه
- استفاده از معیار اطمینان
- مدلهای افزوده
* مدل آشغال عمومي
* مدل آشغال حاوي ریزواژه
مطل كيل
صفحه 3:
کلمات خارج از واژگان
سیستمهای بازشناشی محدوة ay انتخاب واقه از ذاخل واذهنامة خود هستند.
سیستم به هنگام برخورد با يك وایّه خارج از واژهنامه به اشتباه يكي از کلمات
داخل واژهنامه را تشخیص میدهد
کلمات خارج از واژگان بیشتر نامهاي خاص هستند و تشخیص درست آنها
بسیار كليدي است
کلمات خارج از واژگان عامل مهمي در افزایش خطا در سیستم هاي بازشناسي
Aidan at
تشخیص نادرست یک واژه باعث انتقال خطا به واژگان بعدي خود مي شوند
صفحه 4:
راه حل ابتدايي
* اكر تابع احتمال روبرو از 5
یک آستانه کمتر بود واژه 019 a
خارج از واژهنامه است
* در تثوري خوب به نظر مي رسد
* در عمل با مشکلات فراوانی همراه است
* حذف مخرج نرمالسار در رابطه بیز و سادهسازي هاي فراوان
باعث کاهش دقت و عدم كارايي ميشود
صفحه 5:
معیار اطمینان
"معیار اطمینان " " عددي است بین 0و 1 که به خروجي سيستم بازشناسي
فتا ار عاق مي یرد و بیان کننده میزان اطمینان سیستّم از خروجي ا
معيار اظمينان ون سطوح متا
- سطح ادراک
- سطح جمله
- سطح واژه
- سطح واج
تابع ويژگي هاي مختلف
- امتياز كلى جذب مدل
- ميانكين حسابي يا هندسي امتياز واجها
صفحه 6:
مدل های افزوده
* در کاربردهای واقعی هر اندازه که مجموعه واژگان را بزرگ در
نظر بگیریم وقوع کلمات جدید يا ناقص ادا شده و حتی
نویزهای غیر گفتار اجتناب ناپذیر است 1
* يكي از راههاي مواجه با این مشکل افزودن مدل یا مدلهايي به
مجموعه مدلهای سیستم است که برای شناسایی کلمات خارج
از وژهنامه به کار میروند ۱ ۱
* کلمات داخل واژهنامه توسط مدلهای اصلی سیستم بازشناسی
می شوند و کلمات خارج از واژهنامه توسط مدلهای افزوده شده
به سيستم جذب مي كردند
صفحه 7:
*کلمات داخل واژهنامه توسط | ۱
مدلهاي پاييني شناسايي 1 (OV Class |
ميشوند أعسم [ تفص از
۱ + ۱
i | ۱
*کلمات بیرون از وژهنامه توسط م أ cov cusp |
© در و 7 1 1
مدلهاي اضافه شده شناسابي | > هد
ميشوند ۱ ‘Word t | د
از که Word? لا ۱
' 1 |
|
Word 0 1
1
1 ۲
! '
; لط هيا
صفحه 8:
مدل آشغال (پرکننده)
‘ اين مدلها به شیوه اي خاص طراحي ميشوند و آموزش
ميبینند که بتوانند به ازاي هر کلمه جدید امتیاز بيشتري
نسبت به مدلهاي اصلي سیستم تولید نمایند
۰ در حالت كلي به دو دسته تقسیم ميشوند
- مدل آشغال عمومي
- مدل آشغال حاوي ریزواژهها
صفحه 9:
در این مدل از یک ۳۱۱۷۷ استفاده می شود
سیگنال گفتاري که حاوي کلمات شناخته شده براي سیستم
بازشناسي گفتار نيست براي آموزش اين مدل به کار برده
صفحه 10:
مدل آشغال حاوي ریزواژهها
* دراين روش مدل أشغال حاوي
شبكه اي از مدلهاي اموزش
ديده براي واحدهاي ريزوازه
است
با وجود محدود بودن تعداد اين
واحدهاء شبكه قادر به يوشش
دادن هر كلمه ورودي جديد
خواهد بود 0
صفحه 11:
مدل آشغال حاوي ریزواژهها
سيستم به كونداي طراحي
ميشود كه دو بخش خارج از
وازهنامه و داخل وازهنامه رقيب
تشخيص يك كلمه به عنوان
خارج از واژهنامه با جریمه همراه
خواهد بود
صفحه 12:
مدل آشغال حاوي ریزواژهها
W = argmax P(A|W)P(W)
P(AJU)P(U | yc an eae
OOV)P(OOV)
*خروجي بخش داخل واژهنامه
*هر کدام که مقدار بيشتري داشت به
عنوان خروجي سیستم انتخاب مي شود
"این روش توانايي افزایش بیشمار واژگان
به واژهنامه خود را دارد
صفحه 13:
مدل مكمل
تركيبي از دو روش قبلي است
انعطاف بالاي مدل ریزواژهها
پيچيدگي محاسباتي مدل عمومي
* با ترکیب نزدیکترین جفت گوسینها و جايگزاري نتیجه حاصل در
مجموعه تعداد گوسین ها در هر مرحله يكي کم ميشود
* با این روش مدل ریزواژهها را به مدل عمومي شبیه مي کنیم
ادعا شده است با کاهش 9699/5 تعداد تلفیق ها دقت در حدود
5 کاهش مي یبد
صفحه 14:
تغییر آستانه معیار اطمینان در حین فرایند بازشناسي
استفاده از معیار زباني در معیار اطمینان
استخراج برخط معیار اطمینان
صفحه 15:
