پردازش زبان طبیعی (NLP)
اسلاید 1: پردازش زبان طبیعی (NLP) با تمرکز بر باز شناسی خودکار گفتار ASRگردآورنده : محسن ساریخانیبهار 1395
اسلاید 2: پردازش زبان طبیعی چیست ؟ استفاده از رايانه به منظور پردازش زبان گفتاری و نوشتاری و به طور دقیق تر ماشينی کردن فرايند درک و برداشت مفاهيم بيان شده توسط يک زبان طبيعی انسانیهدف اصلی پردازش زبان طبیعی ايجاد تئوريهاي محاسباتي از زبان، با استفاده از الگوريتمها و ساختارهاي دادهاي موجود در علوم رايانهای
اسلاید 3: زمینه های کاری NLPAutomatic Speech Recognition (ASR) بازشناسی خودکار گفتار Text-To-Speech (TTS) تبدیل متن به گفتار Machine Translation (MT) ترجمه ماشینی Optical Character Recognition (OCR) باز شناسی کاراکتر های نوری و ...
اسلاید 4: بازشناسي خودکار گفتار Automatic Speech Recognition (ASR)زبان معمولترين رسانه ارتباطي و ابزار بازنمايي جهان در ذهن انسان گفتار ساده ترين و رايج ترين ابزار ارتباطي انسانها اولين دستاورد بازشناسي گفتار: راحتتر کردن ارتباطات بين انسان و ماشينها دسترسي به تکنولوژي همواره منجر به برتري ميگردد، برتري براي تکنولوژي بازشناسي گفتار ميتواند از ابعاد مختلف فرهنگي، اجتماعي، اقتصادي، نظامي-سياسي و علمي باشد
اسلاید 5: چرا سیستم های باز شناسی خودکار گفتار مهم هستند ؟ اهميت فرهنگيکمک به زبان و صيانت از بزرگترين ميراث فرهنگي ملت بويژه در محيط رايانه و اينترنتاستفاده بيشتر از زبان و زنده نگه داشتن آن فراهم کردن بستر ايجاد تعامل بيشتر با زبان و کمک به ابعاد توريستي، سياسي ، تجاري راحتتر کردن ارتباط افراد با زبانهاي مختلف با زبان مورد نظر (مترجم گفتار به گفتار)
اسلاید 6: چرا سیستم های باز شناسی خودکار گفتار مهم هستند ؟ اهميت اجتماعيايجاد آسايش و سادگي بيشتر، بالا بردن کيفيت ارائه خدمات افزايش سرعت پاسخگوييکسب رضايت مشتريان کمک به معلولين و ...اهميت اقتصادي و تجاري: قابل استفاده در همه کاربردهايي که نياز به ارتباط انسان و ماشين وجود دارد راحتي و سادگي بيشتر، تسريع در انجام کارخستگيناپذير بودن و دسترسي 24 ساعته عملي کردن برخي ارتباطات غير عملي
اسلاید 7: مثال: سيستم IVR مبتني بر گفتار و سيستم IVR کلاسيک
اسلاید 8: سیستم های تشخیص گفتار چگونه عمل می کنند ؟ رویکرد مبتنی برتشخیص الگو داراي دو فاز آموزش Train) ) و آزمون Test) ) آموزش الگوهاي مربوط به هرکلاس (واحدهاي آوايي مانند کلمه، واج و ...) با استفاده از روشهايي مدلسازي ميشوند. آزمون مقايسه گفتار ورودي با الگوهاي آموزش داده شده جهت تشخيص واحدهاي آوايي موجود درگفتار ورودی
اسلاید 9: دیاگرام کلی سیستم بازشناسی خودکار گفتار با رویکرد تشخیص الگو مدلهاي آواييمدلهاي زبانيواژگانتخمين مدلهادادگان گفتاريتخمين مدلهادادگان متنياستخراج ويژگيجستجودنباله کلماتسيگنال گفتارآموزشآزمون
اسلاید 10: اجزای سیستم های بازشناسی خودکار گفتار استخراج ویژگی هدف : کاهش حجم محاسبات و حذف افزونگیهای موجود در سیگنال گفتار با استخراج تعداد محدودی پارامتر از آنبازشناسی گفتار مستقل از گوینده : بایستی حداقل حساسیت را به نحوه ادای آواهای مختلف یک گفتار خاص از نظر کلام و گوینده داشته باشند. باز شناسی گفتار وابسته به گوینده : وابستگی به لحن، شکل و طول مسیر صوتی ، طول گام و غیره
اسلاید 11: اجزای سیستم های بازشناسی خودکار گفتار دادگان های گفتاری تنوع گويندگان و حجم دادگان مهمترين پارامترهاي طراحي دادگانهاي کاربردي زبان انگليسي شامل حدود 200 تا 300 ساعت گفتار با حدود 300 گويندهدادگان های متنی حجم مناسب براي استخراج آمار معتبر = حدود 250 تا 300 ميليون کلمه واژگان
اسلاید 12: مدل های زبانی روش های گرامری : به جملات خروجی ساختار گرامری آن زبان اعمال می شود روش های آماری : احتمال پشت سرهم آمدن کلمات به عنوان مدلهای زبانی استخراج شده و مورد استفاده قرار میگیرند اجزای سیستم های بازشناسی خودکار گفتار
اسلاید 13: مدل های آوایی مدل انطباق زماني پويا (DTW) ) شبکه عصبی مصنوعی (ANN ) مدل مخفی مارکوف (HMM) ) مدل های ترکیبی اجزای سیستم های بازشناسی خودکار گفتار
اسلاید 14: دیاگرام کلی سیستم بازشناسی خودکار گفتار با رویکرد تشخیص الگو مدلهاي آواييمدلهاي زبانيواژگانتخمين مدلهادادگان گفتاريتخمين مدلهادادگان متنياستخراج ويژگيجستجودنباله کلماتسيگنال گفتارآموزشآزمون
اسلاید 15: خطا هاخطای حذف (Deletion) : عدم باز شناسی یک سیگنال آوایی که در گفتار وجود دارد خطای درج (Insertion): عدم وجود واحد آوایی باز شناسی شده در سیگنال گفتار خطای جایگزینی : باز شناسی یك واحد آوایی به اشتباه به جای یک واحد آوایی دیگری خطا های سیستم های بازشناسی خودکار گفتار
اسلاید 16: با تشکر از توجه شما!! پایان
ahmad –
عالی