تکنولوژی بازشناسی گفتار فارسی در صنعت بانکداری
در نمایش آنلاین پاورپوینت، ممکن است بعضی علائم، اعداد و حتی فونتها به خوبی نمایش داده نشود. این مشکل در فایل اصلی پاورپوینت وجود ندارد.
- جزئیات
- امتیاز و نظرات
- متن پاورپوینت
برچسبهای مرتبط
- IVR
- اهمیت فرهنگی
- بازدهی اقتصادی
- بازشناسی خودرکار گفتار زبان فارسی
- بازشناسی خودکار گفتار
- بانکداری
- پاورپوينت تکنولوژی بازشناسی گفتار فارسی در صنعت بانکداری
- پاورپوینت
- پاورپوینت آماده
- پاورپوینت رایگان
- تایپ هوشمند فارسی
- دانلود پاورپوینت
- دانلود پاورپوینت آماده
- دانلود پاورپوینت رایگان
- سیستم IVR
- سیستم های بازشناسی
- سیستم های بازشناسی خودکار
- سیستم های تلفنی
- صنعت بانکداری
- کاربردهای سیستم های بازشناسی
- گفتار فارسی
امتیاز
تکنولوژی بازشناسی گفتار فارسی در صنعت بانکداری
اسلاید 1: هادی ويسیخرداد 1388تکنولوژي بازشناسي گفتار فارسي با رويکردي به صنعت بانکداري
اسلاید 2: بازشناسی گفتار (فارسي) در صنعت بانکداريفهرستمعرفی تکنولوژی بازشناسی گفتار مروري بر کاربردهاي بازشناسي گفتار نمايش عملي سامانه تايپ گفتاري فارسي نويسا نمايش عملي يک سيستم ديالوگ تلفني ويژه بانکداري پرسش و پاسخ
اسلاید 3: عصر گويش پرداز (ASR Gooyesh Pardaz)مروري بر بازشناسي خودکار گفتار (Automatic Speech Recognition- A Review)
اسلاید 4: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-معرفيگفتار سادهترين و کارآمدترين راه ارتباط انسان هاستهدف بازشناسي خودکار گفتار Automatic Speech Recognition (ASR)تبديل گفتار انسان به متن يا دستورالعمل معادل گفتار ميتواند يک فايل صوتي، ورودي با ميکروفون، از طريق خط تلفن و يا فرمان از راه دور باشد.
اسلاید 5: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-معرفييک سيستم بازشناسي کامل :قادر به بازشناسي گفتار پيوسته و محاورهاي باشد.گفتار افراد مختلف، حتي با لهجههاي متفاوت را بازشناسي نمايد.در محيطهاي شلوغ و نويزي هم جوابگو باشد.بصورت بلادرنگ عمل کند.قادر به فراگيري اطلاعات جديد نظير کلمات، قوانين زباني و . . . باشد.سيستمهاي کاربردي امروزي:گفتار بايستي به صورت کتابي باشد.گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به لهجهها منجر به کاهش کارايي ميشود. استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها ميشود. اغلب سيستم هاي کاربردي امروزي تقريبا بلادرنگ هستند.سيستمهاي موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زباني و معنايي به صورت محدود استفاده ميکنند.
اسلاید 6: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهابازشناسي گفتار کار پيچيده اي استارتباط انسان با ماشين امروزه بر پايه دکمه ها و کليدهاست، نه گفتاراگر شما يک کلمه خاص مانند ”آسمان“ را 10 بار مختلف بيان نماييد، تقريبا در هيچ دو حالتي فايل هاي ضبط شده ديجيتالي آنها دقيقا يکسان نيست!پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار ميزان وابستگي يا استقلال از گوينده پيوسته يا گسسته بودن گفتار اندازهي واژگان محدوديتهاي زباني کارايي در حضور نويز و در محيطهاي کاربردي مختلف ابهام آکوستيکي و ميزان اشتباه بين کلمات
اسلاید 7: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار ميزان وابستگي يا استقلال از گوينده گوينده هاي مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و ... با هم متفاوتندوابسته به گوينده (SD: Speaker Dependent): به يک و يا چند گوينده خاص پاسخ ميدهدمستقل از گوينده (SI: Speaker Independent) به تمام گويندگان يک زبان پاسخ ميدهندبيشتر روشهاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي يا استقلال از گوينده در مورد يک سيستم بازشناسي گفتار، در مرحلهي آموزش مشخص ميشود. دقت بازشناسي در حالت وابسته به گوينده (بعلت محدوديت و تنوع کمتر) بالاتر از حالت مستقل از گوينده (بعلت پيچيدگي بيشتر) است ولي نياز به آموزش سيستم به صداي آن کاربر خاص را دارد. در کاربردهاي واقعي که گوينده از ابتدا مشخص نيست سيستم را مستقل از گوينده آموزش داده ميشود و سپس هنگام استفاده به کمک برخي رويکردها مانند تطبيق (Adaptation)، سيستم براي يک گوينده خاص تطبيق ميشود. در برخي کاربردهاي ديگر مانند بازشناسي از پشت خط تلفن وابسته به گوينده بودن چندان معني خاصي ندارد چون گوينده از ابتدا مشخص نيست.
اسلاید 8: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار پيوسته يا گسسته بودن گفتار محدوديت بر نحوة اداي کلمات توسط گوينده ميزان پيوستگي يا گسستگي کلمات بازشناسي کلمات مجزا (IWR: Isolated Word Recognition)گفتار کلمه به کلمه و کاملاً مجزا – هر فايل صوتي يک کلمهبازشناسي گفتار متصل (Connected Word Recognition)دنبالهاي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل چند کلمه با سکوت در بين کلماتبازشناسي گفتار پيوسته کتابي (CSR: Continuous Speech Recognition)گفتار به صورت ديکته کتابي و روانبازشناسي گفتار پيوسته محاوره اي (Spontaneous Speech)گفتار به صورت کاملاً طبيعي بيان ميشود، شامل جملات ناقص، سرفه، تپق، مکثهاي طولاني و ... است. پيچيدگي بازشناسي گفتار پيوسته و فيالبداهه بسيار زياد است (مشکلات ناشي از اثر بافت مانند مشخص نبودن مرز کلمات متوالي و ادغام شدن ابتداي يک کلمه با انتهاي کلمة قبلي)سيستمهاي امروزي فقط براي خواندن کتابي کاربردي هستند و تشخيص گفتار فيالبداهه يکي از زمينههاي فعال تحقيقات ميباشد.
اسلاید 9: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار اندازهي واژگان اندازة واژگان يا تعداد کلمات مورد استفاده در يک سيستم بازشناسي از عوامل موثر در دقت و سرعت سيستم است. سيستمهاي IWR فقط براي تشخيص تعداد محدودي کلمه طراحي شدهاند درحاليکه بعضي ديگر از سيستمها قادرند مجموعة بزرگي از کلمات را تشخيص دهند. معمولاً دقت يک سيستم بازشناسي با افزايش تعداد کلمات کم ميشود. چرا که در اين حالت کلمات شبيه به هم زياد شده و احتمال جايگزيني يک کلمه با ديگري بيشتر است. واژگان کوچک(Small Vocabulary): 1 تا 99 کلمهواژگان متوسط (Medium Vocabulary): بين 100 تا 1000 کلمهواژگان بزرگ (Large Vocabulary) : بين 1000 تا 60000 کلمهواژگان خيلي بزرگ (Very Large Vocabulary): بيشتر از 60000 کلمه
اسلاید 10: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار محدوديتهاي زباني اطلاعات زباني شامل دستور زبان و معنا از مهمترين اطلاعات مورد استفاده در يک سيستم بازشناسي گفتار استمدل زباني (Language Model) بيانگر اطلاعات زباني در سيستم بازشناسي گفتار هستند. اطلاعات معنايي به ندرت در اين سيستمها استفاده ميشوند ولي محدوديت هاي دستوري تقريباً در تمامي سيستم هاي بازشناسي گفتار پيوسته مورد استفاده قرار ميگيرند. ميزان محدوديتي که توسط مدل زباني درون يک سيستم بازشناسي ايجاد مي شود، پيچيدگي (Perplexity) آن مدل زباني ناميده ميشود که هرچه مقدار اين پيچيدگي کمتر باشد فضاي مورد جستجو کوچکتر ميشود.تاثير اطلاعات زباني در تشخيص (و درک) گفتار در سيستمهاي تشخيص گفتار امروزي تا اندازهاي است که ميتوان ادعا کرد که تحقق يک سيستم تشخيص گفتار با واژگان بزرگ (يا خيلي بزرگ) با کاربرد واقعي بدون استفاده از اطلاعات زباني غير ممکن است.
اسلاید 11: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار کارايي در حضور نويز و در محيطهاي کاربردي مختلف کارايي سيستم هاي بازشناسي گفتار با وجود اثرات مخربي چون نويز، پژواک، تداخل و اعوجاج که معمولاً از محيط، ميکروفن، کانال انتقال و يا صداي گوينده ناشي ميشوند به شدت کاهش مييابد.روشهاي مختلفي جهت مقابله با نويز در سيستمهاي بازشناسي ارائه شده است که ميتوان آنها را در سه دستهي ويژگيهاي مقاوم به نويز، تخمين گفتار تميز و مبتني بر اصلاح مدل آکوستيکي تقسيم کرد. عدم حفظ کارايي سيستم در شرايط واقعي و عملي (که با نويز همراه است) يکي از بزرگترين مشکلات سيستم هاي بازشناسي گفتار امروزي است.
اسلاید 12: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار-پيچيدگيهاپيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار ابهام آکوستيکي و ميزان اشتباه بين کلماتکلماتي که شکل نوشتاري متمايز ولي تلفظ يکسان يا شبيه به هم دارند [هم آوا] سبب ايجاد ابهام آکوستيکي شده و ممکن است بجاي يکديگر بازشناسي شوند مثال: «سمر» و «ثمر» - «خواستن» و «خاستن» - «خويش» و «خيش» - «ارز» و «عرض» و «ارض» - و ...کلماتي که شکل نوشتاري آنها به يکديگر شباهت دارند [هم نگاره] در استخراج مدل زباني دچار اشکال مي کنندمثال: «نُه» و «نه» - «کرد» و «کُرد» - «مهر» و «مُهر» - «گل» و «گِل» - ...هر چه تعداد اينگونه کلمات در بانک واژگان بيشتر شود، دقت سيستم بازشناسي پايينتر ميآيد. براي جبران اين مسأله، سيستم بازشناسي بايد از مدل زباني در سطوح گرامر و معنا کمک گرفت.
اسلاید 13: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- دياگرام کلي سيستم بازشناسي گفتار با رويکرد تشخيص الگو داراي دو فاز آموزش (Train) و آزمون (Test) آموزش الگوهاي مربوط به هرکلاس (واحدهاي آوايي مانند کلمه، واج و ...) با استفاده از روشهايي مدلسازي ميشوند. آزمون (استفاده) مقايسه گفتار ورودي با الگوهاي آموزش داده شده جهت تشخيص واحدهاي آوايي موجود د رگفتار ورودي
اسلاید 14: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- دياگرام کلي سيستم بازشناسي گفتار با رويکرد تشخيص الگو مدلهاي آواييمدلهاي زبانيواژگانتخمين مدلهادادگان گفتاريتخمين مدلهادادگان متنياستخراج ويژگيجستجودنباله کلماتسيگنال گفتارآموزشآزمون
اسلاید 15: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- تعريف اجزامدلسازي آوايي مدل کردن واحدهاي آوايي گفتار (کلمه، هجا، سه واجي، واج)روش ها:مدل انطباق زماني پويا (DTW) ساده و قديمي – مورد استفاده در Voice dialing گوشي هاي تلفن همراهشبکه عصبي مصنوعي (ANN) ساده و کارا، سرعت تشخيص بلادرنگ، نسبتا مقاوم به نويز، فرايند آموزش زمان برمدل مخفي مارکوف (HMM) موفقترين رويکرد، مدل کردن آماري گفتارمدلهاي ترکيبي (ترکيب شبکههاي عصبي و HMM )
اسلاید 16: بازشناسی گفتار (فارسي) در صنعت بانکدارياجزاي سيستمهاي بازشناسي خودکار گفتار- دادگاندادگانهاي گفتاري استفاده جهت تهيه مدلهاي آوايي تنوع گويندگان و حجم دادگان مهمترين پارامترهاي طراحي دادگان هستند. دادگانهاي کاربردي زبان انگليسي شامل حدود 200 تا 300 ساعت گفتار با حدود 300 گوينده هستند. اين دادگان معمولا به صورت فايلهاي صوتي با برچسپ متني معادل در سطح واج يا کلمه هستند که گاهي داراي تقطيع در سطح واج، کلمه يا جمله نيز هستند
اسلاید 17: بازشناسی گفتار (فارسي) در صنعت بانکدارياجزاي سيستمهاي بازشناسي خودکار گفتار- دادگاندادگان هاي متنياستخراج اطلاعات زباني (آماري، معنايي، گرامري)حجم مناسب براي استخراج آمار معتبر = حدود 250 تا 300 ميليون کلمه استخراج خودکار گرامر زبان با استفاده از دادگانهاي پارس شده (tree bank) استخراج معنا از دادگان: دادگان هاي شبکه لغات يا word net واژگان واژگان يا Lexiconها نيز از شامل ليست کلماتي مورد استفاده در سيستم استدر واژگان علاوه بر ليست خود کلمات، اطلاعات مختلفي در مورد هر کلمه مانند احتمال وقوع آن در زبان (احتمال N-gram)، نقش (هاي) گرامري در جمله و ... را نيز شامل ميشود. به اين گونه واژگانها، واژگان محاسباتي گفته ميشود.
اسلاید 18: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- ارزيابيپارامترهاي موثرتعداد کلمات موجود در واژگان سيستم، تعداد کلمات خارج از دادگان مجموعه آزمون (OOV)،سازگاري/عدم سازگاري دادههاي آموزش و آزمون ، محيط آکوستيکي آزمون و ميزان سيگنال به نويز سيگنال گفتاروابسته/مستقل از گويندهخطاهاي خطاي حذف (Deletion)، خطاي درج (Insertion) و خطاي جايگزيني(Substitution)
اسلاید 19: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- ارزيابيمعيارهادقت(Accuracy) صحت (Correctness )نرخ خطاي کلمات (WER) تعداد کل کلماتتعداد کلمات حذف، درج و جايگزين شده
اسلاید 20: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاربازشناسي گفتار از گذشته تاکنون در 5 دهه اخير
اسلاید 21: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاروضعيت کارايي سيستمهاي بازشناسي گفتار امروزي در کاربردهاي مختلف دادگاننوعاندازه واژگانWERرشته اعداد پيوسته - دادگان TIگفتار فيالبداهه11 (صفر تا نه و oh)0.3%RMگفتار کتابي1.0002%ATISگفتار فيالبداهه2.5002.5%NAB/WSJگفتار کتابي64.0006.6%انتشار اخبار (Broadcast News)اخبار تلويزيوني210.00013-17%Switchboardمکالمه تلفني محاورهاي45.00025-29%
اسلاید 22: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتارمقايسه کارايي سيستمهاي بازشناسي خودکار گفتار با انسان خطاي کامپيوتر 10 تا 100 برابر بيشتر از انسان است!
اسلاید 23: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتارآينده سيستمهاي بازشناسي گفتار
اسلاید 24: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاربرخي از مراکز پژوهشي مطرح در سطح جهان در زمينه بازشناسي گفتارواحد تحقيقات پردازش گفتار مايکروسافتگروه گفتار دانشگاه CMU گروه LTI دانشگاه CMU گروه گفتار در آزمايشگاه هوش ماشين دانشگاه کمبريج آزمايشگاه CSLU دانشگاه اورگون آزمايشگاه CSLR دانشگاه کلرادو گروه CSLP در دانشگاه جان هاپکينز گروه گفتار ICSI دانشگاه برکلي آزمايشگاه STAR در SRI آزمايشگاه SAIL دانشگاه کاليفرنياي جنوبي (USC) گروه HLT در IBM گروه LDC و آزمايشگاهLINC از دانشگاه پنسيلوانيا گروه SLS در آزمايشگاه CSAIL دانشگاه MIT
اسلاید 25: عصر گويش پرداز (ASR Gooyesh Pardaz)اهميت و کاربردهاي سيستم هاي بازشناسي خودکار گفتار
اسلاید 26: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- اهميتزبان معمولترين رسانه ارتباطي و ابزار بازنمايي جهان در ذهن انسان است گفتار ساده ترين و رايج ترين ابزار ارتباطي انسانها استاولين دستاورد بازشناسي گفتار: راحتتر کردن ارتباطات بين انسان و ماشينها دسترسي به تکنولوژي همواره منجر به برتري ميگردد، برتري براي تکنولوژي بازشناسي گفتار ميتواند از ابعاد مختلف فرهنگي، اجتماعي، اقتصادي، نظامي-سياسي و علمي باشد
اسلاید 27: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- اهميتاهميت فرهنگيکمک به زبان و صيانت از بزرگترين ميراث فرهنگي ملت بويژه در محيط رايانه و اينترنتاستفاده بيشتر از زبان و زنده نگه داشتن آن فراهم کردن بستر ايجاد تعامل بيشتر با زبان و کمک به ابعاد توريستي، سياسي ، تجاري و ...راحتتر کردن ارتباط افراد با زبانهاي مختلف با زبان مورد نظر (مترجم گفتار به گفتار)
اسلاید 28: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- اهميتاهميت اجتماعيايجاد آسايش و سادگي بيشتر، بالا بردن کيفيت ارائه خدمات افزايش سرعت پاسخگوييکسب رضايت مشتريان کمک به معلولين.... مثال: سيستم گزارش راديولوژي شرکت Philips، زمان يک هفتهاي تهيه گزارش به 48 ساعت تقليل يافته و منجر به رضايت بيشتر مشتريان، افزايش سرعت پاسخگويي و صرفه جويي قابل توجه در هزينه شده است.
اسلاید 29: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- اهميتاهميت اقتصادي و تجاري: قابل استفاده در همه کاربردهايي که نياز به ارتباط انسان و ماشين وجود دارد راحتي و سادگي بيشتر، تسريع در انجام کار، خستگيناپذير بودن و دسترسي 24 ساعته عملي کردن برخي ارتباطات غير عملي .... مثال: 1. تسريع ارتباط در سيستم IVR از 2:55 دقيقه به 28 ثانيه، 2. سرعت ديکته گفتاري به طور متوسط حدود 105 کلمه در دقيقه، در حاليکه سرعت متوسط تايپ توسط يک فرد عادي حدود 33 کلمه در دقيقه است بازدهي اقتصادي و کاهش هزينهعلاوه بر سازمانها و جاهاي دولتي، شرکتهاي بزرگي چون Nuance، IBM، فيليپس، مايکروسافت و ... نيز جزو سرمايهگزاران اين تکنولوژي هستند، چراکه به آينده اقتصادي آن مطمئن هستند.
اسلاید 30: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- اهميتمثال: سيستم IVR مبتني بر گفتار و سيستم IVR کلاسيک
اسلاید 31: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاتايپ گفتاري و سيستم ديکته تايپ متن (نامه، گزارش و ... )، مکتوب کردن گفتار جلسات و سخنرانيها، تبديل اخبار به متن معادل و ... هر جايي که نياز به تايپ نوعي متون وجود داشته باشد.قابل استفاده براي همه کاربران رايانه: مديران، پزشکان، وکلا، تايپيست ها، مسئولين دفتر و منشي ها و ...
اسلاید 32: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاکاربرد درسيستمهاي تلفني منشيهاي تلفني (جهت متصل نمودن تماس گيرنده با يک فرد يا يک بخش با بيان گفتار نام فرد يا بخش)، اپراتور خودکار تلفني، سيستمهايIVR، سيستمهاي ارتباط با مشتري و CRM، سيستمهاي تلفن بانک، سيستمهاي اطلاع رساني تلفني، دايرکتوريهاي گوياي تلفني، فرمهاي تلفني و نظر سنجيهاي تلفني، رزرواسيون تلفني، دايرکتوريهاي تلفني با بيان نام فرد يا موسسه، . . . تعيين هويت و شناسايي کاربرانسيستم هاي ديالوگ
اسلاید 33: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهامزاياکاهش زمان صرفه جويي در هزينه تسهيل و تسريع ارتباط مشتريانامنيت بالاتر نسبت به کليد و دکمه هاي تلفن
اسلاید 34: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاتحقيق شرکت Fluency Voice بر سيستم هاي تلفني بانکها70% ترجيح مي دهند با اپراتور انساني کار کنند21% ترجيح مي دهند با اپراتور خودکار مبتني بر گفتار کار کنند9% ترجيح مي دهند با سيستم touch-tone کار کنند تراکنش تلفني با گفتار 40 برابر سريع تر از touch-tone است علت: حذف منوها و راهنمايي هاي مرتبط
اسلاید 35: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاسيستم هاي تلفني بانکي مبتني بر گفتارColumbia Bank سيستم Columbia OnCallشماره تماس 253-305-0050, 1-800-304-0050 Standard Life Bank (UK) توسط Fluency Voice Technology 56% تماس ها و 90% تعيين هويت ها با سيستم گفتاري ABN Amro يکي از 20 بانک بزرگ دنيا با 3500 شعبه در 60 کشور در آمريکا با نام LaSalle Bank
اسلاید 36: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاتشخيص فرامين و دستورات صوتي اجراي برنامه هاي رايانه با گفتن نام آنها، کنترل لوازم خانگي با دستورات صوتياتوماسيون اداري و خانگي مثلا در ساختمانهاي هوشمندفرمان دادن به رباتهافرمانهاي صوتي در خودروکنترل برنامههاي کامپيوتري مثل officeفرمهاي گويا براي ورود اطلاعات با فرامين صوتيتشخيص اعداد (متصل، پيوسته)ورود اطلاعات (data entry)کيوسکهاي اطلاعات دستگاههاي خود پرداز بانکهاو ...
اسلاید 37: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاکاربردهاي مربوط به معلولين، ناشنوايان و نابينايان برقراري ارتباط معلولين حرکتي و نابينايان با ماشينها و رايانه ها فراهم کردن امکان استفاده از سيستم هاي موجود توسط معلولين و نابينايان (مانند سيستم هاي تلفني خودکار) استفاده در سيستمهاي تبديل گفتار به حرکات ايما و اشاره جهت ارتباط با ناشنوايان معلولين، ناشنوايان و نابينايان معمولا توانايي گويايي دارند، از اين حس ميتوانند براي جبران فقدان حس هاي ديگر کمک بگيرند.
اسلاید 38: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاکاربردهايي ترکيبي ترجمه گفتار به گفتار سيستمهاي اتوماسيون اداري و Paper lessسيستمهاي ديالوگ و رابطها گفتاري انسان و ماشين (HMI)تشخيص درستي تلفظ براي سيستمهاي آموزش زباناستفاده در بازيهاي کامپيوتري جهت افزايش قابليتهاي و جذابيتهاي آنها/p2.aspx Praselator
اسلاید 39: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستمهاي بازشناسي خودکار گفتار- کاربردهاساير مواردتشخيص گفتار بر روي کامپيوترهاي جيبي، تلفن همراه و ساير وسايل Hands-free به عنوان رابط کاربر و ورود اطلاعاتجستجوگر واژههاي كليدي در گفتار (Word Spotting)کاربردهاي تحت وب مانند VoiceXMLتصديق و/يا تشخيص هويت گوينده براي کاربردهاي امنيتي ...
اسلاید 40: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت کاربردي بازشناسي گفتارمهمترين شرکت هاي مطرح جهاني در بازشناسي گفتار Nuance (همان ScanSoft)Philips IBM Microsoft BBN Loquendo LumenVox
اسلاید 41: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت کاربردي بازشناسي گفتارمثال : سيستم ديکته مخصوص پزشکان (Nuance)روش کلاسيکهزينه تخميني زمان صرف شده توسط پزشک جهت تهيه اسناد و گزارش بيماران براي هر پزشک به طور متوسط در هر سال 18.000 دلارزمان آماده شدن گزارش (نوشتن گزارش توسط پزشک، تايپ آن توسط منشي، تصحيح توسط پزشک و تايپ اصلاحات)حداقل 48 ساعت روش جديد: استفاده از سيستم دراگون (نسخه 9) هزينه فوق = بين 899 تا 1.039 دلار زمان آماده شدن گزارش = تقريبا همزمان با بيان گفتار و در زمان گزارشگيري (حداکثر 12 ساعت)صرفهجويي در زمان و کاهش هزينه به ميزان 80%
اسلاید 42: عصر گويش پرداز (ASR Gooyesh Pardaz)بازشناسي خودکار گفتار زبان فارسي
اسلاید 43: بازشناسی گفتار (فارسي) در صنعت بانکداريمعرفي شرکت ...شركت عصرگويش پرداز (سهامي خاص) شروع فعاليت: 1381، ثبت : مرداد 1384 اولين و تنها شركت ايراني فعال در زمينه پردازش و تشخيص گفتار هدف: طراحي و توسعه نرم افزارها و سختافزارهاي مبتني بر گفتار (به ويژه براي زبان فارسي) زمينههاي تخصصي:پردازش سيگنال تشخيص گفتار (تبديل گفتار به متن) سنتز گفتار (تبديل متن به گفتار)طراحي دادگانهاي گفتاريپردازش زبان طبيعيبهبود كيفيت گفتار
اسلاید 44: بازشناسی گفتار (فارسي) در صنعت بانکداريمعرفي شرکت ...ارائه دهنده انحصاري سيستم هاي مبتني بر گفتار در فارسيبرخي از محصولات نويسا؛ نرمافزار ديكتة گفتاري براي زبان فارسينيوشا؛ تشخيص گفتار تلفني منـشي خودکار تلفنـي مبتني بر گفتار ، تشخيص اعداد و فرامين صوتي از پشت تلفن، سيستم هاي IVR تلفنـي مبتني بر گفتار جستجوگر واژههاي كليدي در گفتارپارسيا؛ متـرجم صـوتي گفتار به گفتارنويسيار؛ تايپ هوشمند فارسيتشخيص گفتار در كامپيوترهاي كوچك (تلفنهمراه، PDA و... )پارسيا جيبي(مترجم صوتي-نسخه کامپيوتر هاي جيبي) و اجرا کننده صوتي برنامهها
اسلاید 45: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسانويساموتور تشخيص گفتار پيوسته مستقل از گوينده با واژگان بزرگ زبان فارسي توسط شرکت عصر گويش پرداز مشخصات:مبتني بر HMM با مدلسازي واج و سه واجي، استفاده از رايجترين ايدههاي مقاومسازي و تطبيق گوينده استفاده روشهاي مدلهاي زباني آماري و گرامري قابليت استخراج محصولات مختلف نويسا: نرم افزار تايپ گفتاري نيوشا: تشخيص گفتار تلفنيجستجوي کلمات کليدي در گفتار تشخيص فرامين و دستورات صوتي
اسلاید 46: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسانويسا: نرم افزار تايپ گفتاري فارسي با خواندن متن آنرا تايپ نماييد
اسلاید 47: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويساقابليت هاي نويسا (تايپ گفتاري فارسي)دقت تشخيص بسيار بالا (حدود 95%)تايپ سريع متون همزمان با صحبت گويندهامكان نوشتن در همه محيط هاي تايپنرمافزارهاي اتوماسيون، Word، محيطهاي تهيه ايميل و ...قابليت تايپ علائم نگارشي مانند نقطه، علامت سوال و ... با گفتارقابليت تايپ اعداد بهصورت عددي يا حروفيايجاد پروفايل شخصي براي هر گويندهقابليت آموزش به صداي کاربران و يادگيري لهجه و لحن بيان گويندهشامل تمامي لغات پركاربرد زبان فارسي (حدود 21 هزار کلمه)امكان افزودن كلمه جديد به واژگان كاربر در نرمافزارقابليت تطبيق به انشاي کاربر توسط تيم پشتيباني شركت عصرگويشپرداز قابل نصب به صورت تک نسخه و تحت شبکه
اسلاید 48: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسامزاياي نويسا (تايپ گفتاري فارسي)افزايش سرعت تايپ و ورود اطلاعات ديکته گفتاري= به طور متوسط حدود 105 کلمه در دقيقه،سرعت متوسط تايپ توسط يک فرد عادي= حدود 33 کلمه در دقيقهصرفهجويي در زمانکاهش هزينه هاحفظ امنيت اطلاعات در هنگام ورود دادههاجلوگيري از اشتباهات املايي
اسلاید 49: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويساکاربردهاي نويسا:تايپ هرگونه متوني که مستلزم تايپ با صفحه کليد هستند:نامه هاي اداري يا شخصيپاراف نامه هاتايپ گزارشتايپ متون شخصي (يادداشت ها، وبلاگ ها، مقالات و ...) و . . .
اسلاید 50: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسابرخي از مشتريان نويسابانکها (تجارت, ملت, پارسيان, سامان, سرمايه)مجلس شوراي اسلامي ايران (بخش انفورماتيک)سازمان زندانهاي کل کشورسازمان توسعه تجارت ايرانسازمان نظام پرستاريسازمان بازرسي کشورسازمان صنايع و معادن (ستاد تحول اقتصادي)سازمان جهاد کشاورزي سازمان صدا و سيماي جمهوري اسلامي ايران (مرکز تحقيقات, دانشکده)وزارت دفاعستاد مشترک سپاه پاسداران انقلاب اسلامينيروی زميني ارتش قرارگاه خاتم الانبياءبنياد تعاون ناجانيروي مقاومت بسيجشرکت (ملي پالايش و پخش فرآوردههاي نفتي، فولاد مبارکه، بيمه البرز، نفت فلات قاره و ...)دانشگاه (صنعتي شريف، مالک اشتر، امام حسين(ع)، دانشگاه آزاد اسلامي (واحد يزد, قايم شهر))پالايشگاه (آبادان، پالايشگاه تهران) و 000
اسلاید 51: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيتين تکست: نسخه پزشکي نويساتهيه گزارش هاي پزشکان به صورت گفتاري راديولوژي CT MRI ...
اسلاید 52: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيجستجوگر کلمات کليدي در گفتارکاربردها: استخراج و طبقهبندي اطلاعات گفتاري شنود و رديابي مکالمههاي تلفني
اسلاید 53: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيکاربردها:منشي خودکار تلفني مبتني بر گفتارتشخيص اعداد و فرامين صوتي از پشت تلفنتلفن گوياي اطلاعرساني سازمانها با قابليت تشخيصگفتار
اسلاید 54: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيسيستم IVR تلفني مبتني بر گفتار براي بانک ها
اسلاید 55: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيپزشک تلفني: تلفن گوياي بهداشت و قرآن با قابليت تشخيص گفتار
اسلاید 56: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيبازشناسي گفتار روي PDAپارسيا-جيبي: مترجم گفتار به گفتار
اسلاید 57: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيتشخيص فرامين صوتيکاربردها:اجراکننده صوتي برنامههااتوماسيون خانگي و صنعتي با به كارگيري تشخيص گفتارسيستم صوتي قرآن زبان گوياي فارسي براي نرم افزارهاي آفيس آموزش و بازي مبتني بر تشخيص گفتار براي کودکان
اسلاید 58: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيفرم هاي شنواپر کردن فرم هاي کامپيوتري به صورت گفتاري
اسلاید 59: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيپارسيا: مترجم گفتار به گفتارترجمه جملات و عبارات رايج مکالمات روزمره فارسي به انگليسي و عربي
اسلاید 60: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينويسيار: تايپ هوشمند فارسي پيش بيني کلمات بعدي بصورت هوشمند در هنگام تايپ
اسلاید 61: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيقابليت هاي نويسيار (تايپ هوشمند فارسي)تايپ سريع و آسان از طريق پيش بيني کلمات بعدي بصورت هوشمند جلوگيري از اشتباهات تايپي و املايي تکميل خودکار کلمات در حين تايپ متناسب با محتواي متن بکارگيري اطلاعات دستوري و آماري زبان فارسي سازگار با Notepad، M.S. Word™ و M.S. Outlook™سازگار با M.S. Office 2000,XP, 2003, 2007
اسلاید 62: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعکتابهاS. Young, et. al., the HTKBook Version 3.2, http://htk.eng.cam.ac.uk/, 2002.X.D. Huang, A. Acero, and H. Hon, Spoken language processing, Prentice Hall, 2000.Daniel Jurafsky, James H. Martin, SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice-Hall, 2000.Chris Manning, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, May 1999.E.A. Wan, A.T. Nelson, Handbook of Neural Networks for Speech Processing, Boston, USA, 1998.L. Rabiner, B.H. Juang, Fundamentals of Speech Recognition, Prentice Hall, 1993.J.R. Deller, J.G. Proakis & J.H.L. Hansen, Discrete-Time Processing of Speech Signals, Macmillan Publishing Company, 1993.
اسلاید 63: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپاياننامهها و مقالاتLawrence Rabiner, Challenges in Speech in Speech Recognition and Natural Recognition and Natural Language Processing Language Processing, Lecture, SPECOM2006, June 25th, 2006. Barker, J., Coy, A., Ma, N., Cooke, M., Recent advances in speech fragment decoding techniques. In: Proc. Interspeech, pp. 85–88, 2006.B.-H. Juang and L. R. Rabiner, Automatic speech recognition - A brief history of the technology development, K. Brown (Ed.) Encyclopedia of Language and Linguistics, Elsevier, 2005 Sadaoki Furui, 50 Years of Progress in Speech and Speaker Recognition Research, ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY VOL.1, NO.2 NOVEMBER 2005. S. Furui, Recent progress in corpus-based spontaneous speech recognition, IEICE Trans. Inf. & Syst., E88-D, 3, pp. 366-375, 2005S. Furui, Speech-to-text and speech-to-speech summarization of spontaneous speech, IEEE Trans. Speech & Audio Processing, 12, 4, pp. 401- 408, 2004 L. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.S. Katagiri, Speech pattern recognition using neural networks, W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003.
اسلاید 64: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپاياننامهها و مقالاتL. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.S. Katagiri, Speech pattern recognition using neural networks, W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003. Seltzer, M. L., Microphone Array Processing for Robust Speech Recognition, PhD Thesis, Carnegie Mellon University, Pittsburgh, PA, USA, 2003.DUSAN, S., and FLANAGAN, J., Adaptive Dialog Based upon Multimodal Language Acquisition, The Fourth IEEE International Conference on Multimodal Interfaces, Pittsburgh, PA, USA, pp. 135-140, 2002.H. G. Hirsch, D. Pearce, The AURORA Experimental Framework for the Performance Evaluations of Speech Recognition Systems under Noisy Conditions, ISCA ITRW ASR2000, Paris, September 2000.Bazzi, I, Modeling Out-of-Vocabulary words for Robust Speech Recognition, PhD Thesis, MIT, 2000.Martin S., Liemann J., Ney H., Algorithms for Bi-gram and Tri-gram Word Clustering, Speech Communication 24, 1998.R. P. Lippmann, Speech recognition by machines and humans, Speech Communication, 22,pp. 1-15, 1997.
اسلاید 65: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپاياننامهها و مقالاتP.J. Moreno, Speech Recognition in Noisy Environments, Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania 15213, April 1996.M.J.F. Gales, P.C. Woodland, Mean and Variance Adaptation within the MLLR Framework, Computer Speech & Language, Vol. 10, PP.249-264, 1996.M. K. Ravishankar, Efficient Algorithms for Speech Recognition, PhD thesis, Carnegie Mellon University, 1996.M.J.F. Gales, Model-Based Techniques for Noise Robust Speech Recognition, Ph.D. thesis, University of Cambridge, September 1995.Brown P.F., Della Pietra V.J., deSouza P.V., Lai J.C., Mercer R. L., Class-Based n-gram Models of Natural Language, Computational Linguistics, Vol. 18, No. 4, pp. 467-479, 1992.C. H. Lee, et. al., Acoustic modeling for large vocabulary speech recognition, Computer Speech and Language, 4, pp. 127-165, 1990. A. Acero, Acoustical and Environmental Robustness in Automatic Speech Recognition, Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania, September 1990.
اسلاید 66: بازشناسی گفتار (فارسي) در صنعت بانکداريتماس با عصر گويش پردازآدرس و تلفن تهران - صندوق پستي: 1516- 13445 تلفکس: 66003710 (021)وب سايت و پست الکترونيکي www.asr-gooyesh.com info@asr-gooyesh.com
خرید پاورپوینت توسط کلیه کارتهای شتاب امکانپذیر است و بلافاصله پس از خرید، لینک دانلود پاورپوینت در اختیار شما قرار خواهد گرفت.
در صورت عدم رضایت سفارش برگشت و وجه به حساب شما برگشت داده خواهد شد.
در صورت نیاز با شماره 09353405883 در واتساپ، ایتا و روبیکا تماس بگیرید.
- پاورپوینتهای مشابه
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.