سایر تحقیق و پژوهش

تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری

technology_baz_shenasi_goftare_farsi_ba_roykardi_be_sanate_bankdari

در نمایش آنلاین پاورپوینت، ممکن است بعضی علائم، اعداد و حتی فونت‌ها به خوبی نمایش داده نشود. این مشکل در فایل اصلی پاورپوینت وجود ندارد.




  • جزئیات
  • امتیاز و نظرات
  • متن پاورپوینت

امتیاز

درحال ارسال
امتیاز کاربر [0 رای]

نقد و بررسی ها

هیچ نظری برای این پاورپوینت نوشته نشده است.

اولین کسی باشید که نظری می نویسد “تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری”

تکنولوژی بازشناسی گفتار فارسی با رویکردی به صنعت بانکداری

اسلاید 1: هادی ويسیخرداد 1388تکنولوژي بازشناسي گفتار فارسي با رويکردي به صنعت بانکداري

اسلاید 2: بازشناسی گفتار (فارسي) در صنعت بانکداريفهرستمعرفی تکنولوژی بازشناسی گفتار مروري بر کاربردهاي بازشناسي گفتار نمايش عملي سامانه تايپ گفتاري فارسي نويسا نمايش عملي يک سيستم‌ ديالوگ تلفني ويژه بانکداري پرسش و پاسخ

اسلاید 3: عصر گويش پرداز (ASR Gooyesh Pardaz)مروري بر بازشناسي خودکار گفتار (Automatic Speech Recognition- A Review)

اسلاید 4: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-معرفيگفتار ساده‌ترين و کارآمدترين راه ارتباط انسان هاستهدف بازشناسي خودکار گفتار Automatic Speech Recognition (ASR)تبديل گفتار انسان به متن يا دستورالعمل معادل گفتار مي‌تواند يک فايل صوتي، ورودي با ميکروفون، از طريق خط تلفن و يا فرمان از راه دور باشد.

اسلاید 5: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-معرفييک سيستم بازشناسي کامل :قادر به بازشناسي گفتار پيوسته و محاوره‌اي باشد.گفتار افراد مختلف، حتي با لهجه‌هاي متفاوت را بازشناسي نمايد.در محيط‌هاي شلوغ و نويزي هم جوابگو باشد.بصورت بلادرنگ عمل کند.قادر به فراگيري اطلاعات جديد نظير کلمات، قوانين زباني و . . . باشد.سيستم‌‌هاي کاربردي امروزي:گفتار بايستي به صورت کتابي باشد.گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به لهجه‌ها منجر به کاهش کارايي مي‌شود. استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها مي‌شود. اغلب سيستم هاي کاربردي امروزي تقريبا بلادرنگ هستند.سيستم‌هاي موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زباني و معنايي به صورت محدود استفاده مي‌کنند.

اسلاید 6: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هابازشناسي گفتار کار پيچيده اي استارتباط انسان با ماشين امروزه بر پايه دکمه ها و کليدهاست، نه گفتاراگر شما يک کلمه خاص مانند ”آسمان“ را 10 بار مختلف بيان نماييد، تقريبا در هيچ دو حالتي فايل هاي ضبط شده ديجيتالي آنها دقيقا يکسان نيست!پيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار ميزان وابستگي يا استقلال از گوينده  پيوسته يا گسسته بودن گفتار  اندازه‌ي واژگان  محدوديت‌هاي زباني  کارايي در حضور نويز و در محيط‌هاي کاربردي مختلف  ابهام آکوستيکي و ميزان اشتباه بين کلمات

اسلاید 7: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار ميزان وابستگي يا استقلال از گوينده گوينده هاي مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و ... با هم متفاوتندوابسته به گوينده (SD: Speaker Dependent): به يک و يا چند گوينده‌ خاص پاسخ مي‌دهدمستقل از گوينده (SI: Speaker Independent) به تمام گويندگان يک زبان پاسخ مي‌دهندبيشتر روش‌هاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي يا استقلال از گوينده در مورد يک سيستم بازشناسي گفتار، در مرحله‌ي آموزش مشخص مي‌شود. دقت بازشناسي در حالت وابسته به گوينده (بعلت محدوديت و تنوع کمتر) بالاتر از حالت مستقل از گوينده (بعلت پيچيدگي بيشتر) است ولي نياز به آموزش سيستم به صداي آن کاربر خاص را دارد. در کاربردهاي واقعي که گوينده از ابتدا مشخص نيست سيستم را مستقل از گوينده آموزش داده مي‌شود و سپس هنگام استفاده به کمک برخي رويکردها مانند تطبيق (Adaptation)، سيستم براي يک گوينده خاص تطبيق مي‌شود. در برخي کاربردهاي ديگر مانند بازشناسي از پشت خط تلفن وابسته به گوينده بودن چندان معني خاصي ندارد چون گوينده از ابتدا مشخص نيست.

اسلاید 8: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار  پيوسته يا گسسته بودن گفتار محدوديت‌ بر نحوة اداي کلمات توسط گوينده ميزان پيوستگي يا گسستگي کلمات بازشناسي کلمات مجزا (IWR: Isolated Word Recognition)گفتار کلمه به کلمه و کاملاً مجزا – هر فايل صوتي يک کلمهبازشناسي گفتار متصل (Connected Word Recognition)دنباله‌اي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل چند کلمه با سکوت در بين کلماتبازشناسي گفتار پيوسته کتابي (CSR: Continuous Speech Recognition)گفتار به صورت ديکته کتابي و روانبازشناسي گفتار پيوسته محاوره اي (Spontaneous Speech)گفتار به صورت کاملاً طبيعي بيان ميشود، شامل جملات ناقص، سرفه، تپق، مکث‌هاي طولاني و ... است. پيچيدگي بازشناسي گفتار پيوسته و في‌البداهه بسيار زياد است (مشکلات ناشي از اثر بافت مانند مشخص نبودن مرز کلمات متوالي و ادغام شدن ابتداي يک کلمه با انتهاي کلمة قبلي)سيستم‌هاي امروزي فقط براي خواندن کتابي کاربردي هستند و تشخيص گفتار في‌البداهه يکي از زمينه‌‌هاي فعال تحقيقات مي‌باشد.

اسلاید 9: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار  اندازه‌ي واژگان اندازة واژگان يا تعداد کلمات مورد استفاده در يک سيستم بازشناسي از عوامل موثر در دقت و سرعت سيستم است. سيستم‌هاي IWR فقط براي تشخيص تعداد محدودي کلمه طراحي شده‌اند درحالي‌که بعضي ديگر از سيستم‌ها قادرند مجموعة بزرگي از کلمات را تشخيص دهند. معمولاً دقت يک سيستم بازشناسي با افزايش تعداد کلمات کم مي‌شود. چرا که در اين حالت کلمات شبيه به هم زياد شده و احتمال جايگزيني يک کلمه با ديگري بيشتر است. واژگان کوچک(Small Vocabulary): 1 تا 99 کلمهواژگان متوسط (Medium Vocabulary): بين 100 تا 1000 کلمهواژگان بزرگ (Large Vocabulary) : بين 1000 تا 60000 کلمهواژگان خيلي بزرگ (Very Large Vocabulary): بيشتر از 60000 کلمه

اسلاید 10: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار محدوديت‌هاي زباني اطلاعات زباني شامل دستور زبان و معنا از مهمترين اطلاعات مورد استفاده در يک سيستم بازشناسي گفتار استمدل زباني (Language Model) بيانگر اطلاعات زباني در سيستم بازشناسي گفتار هستند. اطلاعات معنايي به ندرت در اين سيستم‌ها استفاده مي‌شوند ولي محدوديت هاي دستوري تقريباً در تمامي سيستم هاي بازشناسي گفتار پيوسته مورد استفاده قرار مي‌گيرند. ميزان محدوديتي که توسط مدل زباني درون يک سيستم بازشناسي ايجاد مي شود، پيچيدگي (Perplexity) آن مدل زباني ناميده مي‌شود که هرچه مقدار اين پيچيدگي کمتر باشد فضاي مورد جستجو کوچک‌تر مي‌شود.تاثير اطلاعات زباني در تشخيص (و درک) گفتار در سيستم‌هاي تشخيص گفتار امروزي تا اندازه‌اي است که مي‌توان ادعا کرد که تحقق يک سيستم تشخيص گفتار با واژگان بزرگ (يا خيلي بزرگ) با کاربرد واقعي بدون استفاده از اطلاعات زباني غير ممکن است.

اسلاید 11: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار کارايي در حضور نويز و در محيط‌هاي کاربردي مختلف کارايي سيستم هاي بازشناسي گفتار با وجود اثرات مخربي چون نويز، پژواک، تداخل و اعوجاج که معمولاً از محيط، ميکروفن، کانال انتقال و يا صداي گوينده ناشي مي‌شوند به شدت کاهش مي‌يابد.روش‌هاي مختلفي جهت مقابله با نويز در سيستم‌هاي بازشناسي ارائه شده است که مي‌توان آنها را در سه دسته‌ي ويژگي‌هاي مقاوم به نويز، تخمين گفتار تميز و مبتني بر اصلاح مدل آکوستيکي تقسيم کرد. عدم حفظ کارايي سيستم در شرايط واقعي و عملي (که با نويز همراه است) يکي از بزرگترين مشکلات سيستم هاي بازشناسي گفتار امروزي است.

اسلاید 12: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار-پيچيدگي‌هاپيچيدگي‌هاي مطرح در سيستم‌هاي بازشناسي گفتار ابهام آکوستيکي و ميزان اشتباه بين کلماتکلماتي که شکل نوشتاري متمايز ولي تلفظ يکسان يا شبيه به هم دارند [هم آوا] سبب ايجاد ابهام آکوستيکي شده و ممکن است بجاي يکديگر بازشناسي شوند مثال: «سمر» و «ثمر» - «خواستن» و «خاستن» - «خويش» و «خيش» - «ارز» و «عرض» و «ارض» - و ...کلماتي که شکل نوشتاري آنها به يکديگر شباهت دارند [هم نگاره] در استخراج مدل زباني دچار اشکال مي کنندمثال: «نُه» و «نه» - «کرد» و «کُرد» - «مهر» و «مُهر» - «گل» و «گِل» - ...هر چه تعداد اين‌گونه کلمات در بانک واژگان بيشتر شود، دقت سيستم بازشناسي پايين‌تر مي‌آيد. براي جبران اين مسأله، سيستم بازشناسي بايد از مدل زباني در سطوح گرامر و معنا کمک گرفت.

اسلاید 13: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- دياگرام کلي سيستم بازشناسي گفتار با رويکرد تشخيص الگو داراي دو فاز آموزش (Train) و آزمون (Test) آموزش الگوهاي مربوط به هرکلاس (واحدهاي آوايي مانند کلمه، واج و ...) با استفاده از روش‌هايي مدل‌سازي مي‌شوند. آزمون (استفاده) مقايسه گفتار ورودي با الگوهاي آموزش داده شده جهت تشخيص واحدهاي آوايي موجود د رگفتار ورودي

اسلاید 14: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- دياگرام کلي سيستم بازشناسي گفتار با رويکرد تشخيص الگو مدلهاي آواييمدلهاي زبانيواژگانتخمين مدلهادادگان گفتاريتخمين مدلهادادگان متنياستخراج ويژگي‌جستجودنباله کلماتسيگنال گفتارآموزشآزمون

اسلاید 15: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- تعريف اجزامدل‌سازي آوايي مدل کردن واحدهاي آوايي گفتار (کلمه، هجا، سه واجي، واج)روش ها:مدل انطباق زماني پويا (DTW) ساده و قديمي – مورد استفاده در Voice dialing گوشي هاي تلفن همراهشبکه عصبي مصنوعي (ANN) ساده و کارا، سرعت تشخيص بلادرنگ، نسبتا مقاوم به نويز، فرايند آموزش زمان برمدل مخفي مارکوف (HMM) موفق‌ترين رويکرد، مدل کردن آماري گفتارمدل‌هاي ترکيبي (ترکيب شبکه‌هاي عصبي و HMM )

اسلاید 16: بازشناسی گفتار (فارسي) در صنعت بانکدارياجزاي سيستم‌هاي بازشناسي خودکار گفتار- دادگاندادگان‌هاي گفتاري استفاده جهت تهيه مدل‌هاي آوايي تنوع گويندگان و حجم دادگان مهمترين پارامترهاي طراحي دادگان هستند. دادگان‌هاي کاربردي زبان انگليسي شامل حدود 200 تا 300 ساعت گفتار با حدود 300 گوينده هستند. اين دادگان معمولا به صورت فايل‌هاي صوتي با برچسپ متني معادل در سطح واج يا کلمه هستند که گاهي داراي تقطيع در سطح واج، کلمه يا جمله نيز هستند

اسلاید 17: بازشناسی گفتار (فارسي) در صنعت بانکدارياجزاي سيستم‌هاي بازشناسي خودکار گفتار- دادگاندادگان هاي متنياستخراج اطلاعات زباني (آماري، معنايي، گرامري)حجم مناسب براي استخراج آمار معتبر = حدود 250 تا 300 ميليون کلمه استخراج خودکار گرامر زبان با استفاده از دادگان‌هاي پارس شده (tree bank) استخراج معنا از دادگان: دادگان هاي شبکه لغات يا word net واژگان واژگان يا Lexiconها نيز از شامل ليست کلماتي مورد استفاده در سيستم استدر واژگان‌ علاوه بر ليست خود کلمات، اطلاعات مختلفي در مورد هر کلمه مانند احتمال وقوع آن در زبان (احتمال N-gram)، نقش (هاي) گرامري در جمله و ... را نيز شامل مي‌شود. به اين گونه واژگان‌ها، واژگان محاسباتي گفته مي‌شود.

اسلاید 18: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- ارزيابيپارامترهاي موثرتعداد کلمات موجود در واژگان سيستم، تعداد کلمات خارج از دادگان مجموعه آزمون (OOV)،سازگاري/عدم سازگاري داده‌هاي آموزش و آزمون ، محيط آکوستيکي آزمون و ميزان سيگنال به نويز سيگنال گفتاروابسته/مستقل از گويندهخطاهاي خطاي حذف (Deletion)، خطاي درج (Insertion) و خطاي جايگزيني(Substitution)

اسلاید 19: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- ارزيابيمعيارهادقت(Accuracy) صحت (Correctness )نرخ خطاي کلمات (WER) تعداد کل کلماتتعداد کلمات حذف، درج و جايگزين شده

اسلاید 20: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاربازشناسي گفتار از گذشته تاکنون در 5 دهه اخير

اسلاید 21: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاروضعيت کارايي سيستم‌هاي بازشناسي گفتار امروزي در کاربردهاي مختلف دادگاننوعاندازه واژگانWERرشته اعداد پيوسته - دادگان TIگفتار في‌البداهه11 (صفر تا نه و oh)0.3%RMگفتار کتابي1.0002%ATISگفتار في‌البداهه2.5002.5%NAB/WSJگفتار کتابي64.0006.6%انتشار اخبار (Broadcast News)اخبار تلويزيوني210.00013-17%Switchboardمکالمه تلفني محاوره‌اي45.00025-29%

اسلاید 22: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتارمقايسه کارايي سيستم‌هاي بازشناسي خودکار گفتار با انسان خطاي کامپيوتر 10 تا 100 برابر بيشتر از انسان است!

اسلاید 23: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتارآينده سيستم‌هاي بازشناسي گفتار

اسلاید 24: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت تحقيقات بازشناسي گفتاربرخي از مراکز پژوهشي مطرح در سطح جهان در زمينه بازشناسي گفتارواحد تحقيقات پردازش گفتار مايکروسافتگروه گفتار دانشگاه CMU گروه LTI دانشگاه CMU گروه گفتار در آزمايشگاه هوش ماشين دانشگاه کمبريج آزمايشگاه CSLU دانشگاه اورگون آزمايشگاه CSLR دانشگاه کلرادو گروه CSLP در دانشگاه جان هاپکينز گروه گفتار ICSI دانشگاه برکلي آزمايشگاه STAR در SRI آزمايشگاه SAIL دانشگاه کاليفرنياي جنوبي (USC) گروه HLT در IBM گروه LDC و آزمايشگاهLINC از دانشگاه پنسيلوانيا گروه SLS در آزمايشگاه CSAIL دانشگاه MIT

اسلاید 25: عصر گويش پرداز (ASR Gooyesh Pardaz)اهميت و کاربردهاي سيستم هاي بازشناسي خودکار گفتار

اسلاید 26: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- اهميتزبان معمولترين رسانه ارتباطي و ابزار بازنمايي جهان در ذهن انسان است گفتار ساده ترين و رايج ترين ابزار ارتباطي انسانها استاولين دستاورد بازشناسي گفتار: راحت‌تر کردن ارتباطات بين انسان و ماشين‌ها دسترسي به تکنولوژي همواره منجر به برتري مي‌گردد، برتري براي تکنولوژي بازشناسي گفتار مي‌تواند از ابعاد مختلف فرهنگي، اجتماعي، اقتصادي، نظامي-سياسي و علمي باشد

اسلاید 27: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- اهميتاهميت فرهنگيکمک به زبان و صيانت از بزرگترين ميراث فرهنگي ملت بويژه در محيط رايانه و اينترنتاستفاده بيشتر از زبان و زنده نگه داشتن آن فراهم کردن بستر ايجاد تعامل بيشتر با زبان و کمک به ابعاد توريستي، سياسي ، تجاري و ...راحت‌تر کردن ارتباط افراد با زبانهاي مختلف با زبان مورد نظر (مترجم گفتار به گفتار)

اسلاید 28: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- اهميتاهميت اجتماعيايجاد آسايش و سادگي بيشتر، بالا بردن کيفيت ارائه خدمات افزايش سرعت پاسخگوييکسب رضايت مشتريان کمک به معلولين.... مثال: سيستم گزارش راديولوژي شرکت Philips، زمان يک هفته‌اي تهيه گزارش به 48 ساعت تقليل يافته و منجر به رضايت بيشتر مشتريان، افزايش سرعت پاسخگويي و صرفه جويي قابل توجه در هزينه شده است.

اسلاید 29: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- اهميتاهميت اقتصادي و تجاري: قابل استفاده در همه کاربردهايي که نياز به ارتباط انسان و ماشين وجود دارد راحتي و سادگي بيشتر، تسريع در انجام کار، خستگي‌ناپذير بودن و دسترسي 24 ساعته عملي کردن برخي ارتباطات غير عملي .... مثال: 1. تسريع ارتباط در سيستم IVR از 2:55 دقيقه به 28 ثانيه، 2. سرعت ديکته گفتاري به طور متوسط حدود 105 کلمه در دقيقه، در حاليکه سرعت متوسط تايپ توسط يک فرد عادي حدود 33 کلمه در دقيقه است بازدهي اقتصادي و کاهش هزينهعلاوه بر سازمان‌ها و جاهاي دولتي، شرکت‌هاي بزرگي چون Nuance، IBM، فيليپس، مايکروسافت و ... نيز جزو سرمايه‌گزاران اين تکنولوژي هستند، چراکه به آينده اقتصادي آن مطمئن هستند.

اسلاید 30: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- اهميتمثال: سيستم IVR مبتني بر گفتار و سيستم IVR کلاسيک

اسلاید 31: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاتايپ گفتاري و سيستم ديکته تايپ متن (نامه، گزارش و ... )، مکتوب کردن گفتار جلسات و سخنرانيها، تبديل اخبار به متن معادل و ... هر جايي که نياز به تايپ نوعي متون وجود داشته باشد.قابل استفاده براي همه کاربران رايانه: مديران، پزشکان، وکلا، تايپيست ها، مسئولين دفتر و منشي ها و ...

اسلاید 32: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاکاربرد درسيستم‌هاي تلفني منشي‌هاي تلفني (جهت متصل نمودن تماس گيرنده با يک فرد يا يک بخش با بيان گفتار نام فرد يا بخش)، اپراتور خودکار تلفني، سيستم‌هايIVR، سيستم‌هاي ارتباط با مشتري و CRM، سيستم‌هاي تلفن بانک، سيستم‌هاي اطلاع رساني تلفني، دايرکتوريهاي گوياي تلفني، فرمهاي تلفني و نظر سنجي‌هاي تلفني، رزرواسيون تلفني، دايرکتوريهاي تلفني با بيان نام فرد يا موسسه، . . . تعيين هويت و شناسايي کاربرانسيستم هاي ديالوگ

اسلاید 33: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهامزاياکاهش زمان صرفه جويي در هزينه تسهيل و تسريع ارتباط مشتريانامنيت بالاتر نسبت به کليد و دکمه هاي تلفن

اسلاید 34: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاتحقيق شرکت Fluency Voice بر سيستم هاي تلفني بانکها70% ترجيح مي دهند با اپراتور انساني کار کنند21% ترجيح مي دهند با اپراتور خودکار مبتني بر گفتار کار کنند9% ترجيح مي دهند با سيستم touch-tone کار کنند تراکنش تلفني با گفتار 40 برابر سريع تر از touch-tone است علت: حذف منوها و راهنمايي هاي مرتبط

اسلاید 35: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاسيستم هاي تلفني بانکي مبتني بر گفتارColumbia Bank سيستم Columbia OnCallشماره تماس  253-305-0050, 1-800-304-0050 Standard Life Bank (UK) توسط Fluency Voice Technology 56% تماس ها و 90% تعيين هويت ها با سيستم گفتاري ABN Amro يکي از 20 بانک بزرگ دنيا با 3500 شعبه در 60 کشور در آمريکا با نام LaSalle Bank

اسلاید 36: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاتشخيص فرامين و دستورات صوتي اجراي برنامه هاي رايانه با گفتن نام آنها، کنترل لوازم خانگي با دستورات صوتياتوماسيون اداري و خانگي مثلا در ساختمانهاي هوشمندفرمان دادن به ربات‌هافرمان‌هاي صوتي در خودروکنترل برنامه‌هاي کامپيوتري مثل officeفرمهاي گويا براي ورود اطلاعات با فرامين صوتيتشخيص اعداد (متصل، پيوسته)ورود اطلاعات (data entry)کيوسک‌هاي اطلاعات دستگاههاي خود پرداز بانک‌هاو ...

اسلاید 37: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاکاربردهاي مربوط به معلولين، ناشنوايان و نابينايان برقراري ارتباط معلولين حرکتي و نابينايان با ماشينها و رايانه ها فراهم کردن امکان استفاده از سيستم هاي موجود توسط معلولين و نابينايان (مانند سيستم هاي تلفني خودکار) استفاده در سيستم‌هاي تبديل گفتار به حرکات ايما و اشاره جهت ارتباط با ناشنوايان معلولين، ناشنوايان و نابينايان معمولا توانايي گويايي دارند، از اين حس ميتوانند براي جبران فقدان حس هاي ديگر کمک بگيرند.

اسلاید 38: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاکاربردهايي ترکيبي ترجمه گفتار به گفتار سيستم‌هاي اتوماسيون اداري و Paper lessسيستم‌هاي ديالوگ و رابط‌ها گفتاري انسان و ماشين (HMI)تشخيص درستي تلفظ براي سيستم‌هاي آموزش زباناستفاده در بازي‌هاي کامپيوتري جهت افزايش قابليت‌هاي و جذابيت‌هاي آنها/p2.aspx Praselator

اسلاید 39: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم‌هاي بازشناسي خودکار گفتار- کاربردهاساير مواردتشخيص گفتار بر روي کامپيوترهاي جيبي، تلفن همراه و ساير وسايل Hands-free به عنوان رابط کاربر و ورود اطلاعاتجستجوگر واژه‌هاي كليدي در گفتار (Word Spotting)کاربردهاي تحت وب مانند VoiceXMLتصديق و/يا تشخيص هويت گوينده براي کاربردهاي امنيتي ...

اسلاید 40: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت کاربردي بازشناسي گفتارمهمترين شرکت هاي مطرح جهاني در بازشناسي گفتار Nuance (همان ScanSoft)Philips IBM Microsoft BBN Loquendo LumenVox

اسلاید 41: بازشناسی گفتار (فارسي) در صنعت بانکداريمروري بر وضعيت کاربردي بازشناسي گفتارمثال : سيستم ديکته مخصوص پزشکان (Nuance)روش کلاسيکهزينه تخميني زمان صرف شده توسط پزشک جهت تهيه اسناد و گزارش بيماران براي هر پزشک به طور متوسط در هر سال 18.000 دلارزمان آماده شدن گزارش (نوشتن گزارش توسط پزشک، تايپ آن توسط منشي، تصحيح توسط پزشک و تايپ اصلاحات)حداقل 48 ساعت روش جديد: استفاده از سيستم دراگون (نسخه 9) هزينه فوق = بين 899 تا 1.039 دلار زمان آماده شدن گزارش = تقريبا همزمان با بيان گفتار و در زمان گزارش‌گيري (حداکثر 12 ساعت)صرفه‌جويي در زمان و کاهش هزينه به ميزان 80% 

اسلاید 42: عصر گويش پرداز (ASR Gooyesh Pardaz)بازشناسي خودکار گفتار زبان فارسي

اسلاید 43: بازشناسی گفتار (فارسي) در صنعت بانکداريمعرفي شرکت ...شركت عصرگويش پرداز (سهامي خاص) شروع فعاليت: 1381، ثبت : مرداد 1384 اولين و تنها شركت ايراني فعال در زمينه پردازش و تشخيص گفتار هدف: طراحي و توسعه نرم افزارها و سخت‌افزارهاي مبتني بر گفتار (به ويژه براي زبان فارسي) زمينه‌هاي تخصصي:پردازش سيگنال تشخيص گفتار (تبديل گفتار به متن) سنتز گفتار (تبديل متن به گفتار)طراحي دادگان‌هاي گفتاريپردازش زبان طبيعيبهبود كيفيت گفتار

اسلاید 44: بازشناسی گفتار (فارسي) در صنعت بانکداريمعرفي شرکت ...ارائه دهنده انحصاري سيستم هاي مبتني بر گفتار در فارسيبرخي از محصولات نويسا؛ نرم‌افزار ديكتة گفتاري براي زبان فارسينيوشا؛ تشخيص گفتار تلفني منـشي خودکار تلفنـي مبتني بر گفتار ، تشخيص اعداد و فرامين صوتي از پشت تلفن، سيستم‌ هاي IVR تلفنـي مبتني بر گفتار جستجوگر واژه‌هاي كليدي در گفتارپارسيا؛ متـرجم صـوتي گفتار به گفتارنويسيار؛ تايپ هوشمند فارسيتشخيص گفتار در كامپيوترهاي كوچك (تلفن‌‌‌همراه، PDA و... )پارسيا جيبي(مترجم صوتي-نسخه کامپيوتر هاي جيبي) و اجرا کننده صوتي برنامه‌ها

اسلاید 45: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسانويساموتور تشخيص گفتار پيوسته مستقل از گوينده با واژگان بزرگ زبان فارسي توسط شرکت عصر گويش پرداز مشخصات:مبتني بر HMM با مدل‌سازي واج و سه واجي، استفاده از رايج‌ترين ايده‌هاي مقاوم‌سازي و تطبيق گوينده استفاده روشهاي مدل‌هاي زباني آماري و گرامري قابليت استخراج محصولات مختلف نويسا: نرم افزار تايپ گفتاري نيوشا: تشخيص گفتار تلفنيجستجوي کلمات کليدي در گفتار تشخيص فرامين و دستورات صوتي

اسلاید 46: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسانويسا: نرم افزار تايپ گفتاري فارسي با خواندن متن آنرا تايپ نماييد

اسلاید 47: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويساقابليت هاي نويسا (تايپ گفتاري فارسي)دقت تشخيص بسيار بالا (حدود 95%)تايپ سريع متون همزمان با صحبت گويندهامكان نوشتن در همه محيط هاي تايپنر‌م‌افزارهاي اتوماسيون، Word، محيط‌هاي تهيه ايميل و ...قابليت تايپ علائم نگارشي مانند نقطه، علامت سوال و ... با گفتارقابليت تايپ اعداد به‌صورت عددي يا حروفيايجاد پروفايل شخصي براي هر گويندهقابليت آموزش به صداي کاربران و يادگيري لهجه و لحن بيان گويندهشامل تمامي لغات پركاربرد زبان فارسي (حدود 21 هزار کلمه)امكان افزودن كلمه جديد به واژگان كاربر در نرم‌افزارقابليت تطبيق به انشاي کاربر توسط تيم پشتيباني شركت عصرگويش‌پرداز قابل نصب به صورت تک نسخه و تحت شبکه

اسلاید 48: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسامزاياي نويسا (تايپ گفتاري فارسي)افزايش سرعت تايپ و ورود اطلاعات ديکته گفتاري= به طور متوسط حدود 105 کلمه در دقيقه،سرعت متوسط تايپ توسط يک فرد عادي= حدود 33 کلمه در دقيقهصرفه‌جويي در زمانکاهش هزينه هاحفظ امنيت اطلاعات در هنگام ورود داده‌هاجلوگيري از اشتباهات املايي

اسلاید 49: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويساکاربردهاي نويسا:تايپ هرگونه متوني که مستلزم تايپ با صفحه کليد هستند:نامه هاي اداري يا شخصيپاراف نامه هاتايپ گزارشتايپ متون شخصي (يادداشت ها، وبلاگ ها، مقالات و ...) و . . .

اسلاید 50: بازشناسی گفتار (فارسي) در صنعت بانکداريسيستم تشخيص گفتار فارسي نويسابرخي از مشتريان نويسابانک‌ها (تجارت, ملت, پارسيان, سامان, سرمايه)مجلس شوراي اسلامي ايران (بخش انفورماتيک)سازمان زندان‌هاي کل کشورسازمان توسعه تجارت ايرانسازمان نظام پرستاريسازمان بازرسي کشورسازمان صنايع و معادن (ستاد تحول اقتصادي)سازمان جهاد کشاورزي سازمان صدا و سيماي جمهوري اسلامي ايران (مرکز تحقيقات, دانشکده)وزارت دفاعستاد مشترک سپاه پاسداران انقلاب اسلامينيروی زميني ارتش قرارگاه خاتم الانبياءبنياد تعاون ناجانيروي مقاومت بسيجشرکت (ملي پالايش و پخش فرآورده‌هاي نفتي، فولاد مبارکه، بيمه البرز، نفت فلات قاره و ...)دانشگاه (صنعتي شريف، مالک اشتر، امام حسين(ع)، دانشگاه آزاد اسلامي (واحد يزد, قايم شهر))پالايشگاه (آبادان، پالايشگاه تهران) و 000

اسلاید 51: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيتين تکست: نسخه پزشکي نويساتهيه گزارش هاي پزشکان به صورت گفتاري راديولوژي CT MRI ...

اسلاید 52: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيجستجوگر کلمات کليدي در گفتارکاربردها: استخراج و طبقه‌بندي اطلاعات گفتاري شنود و رديابي مکالمه‌هاي تلفني

اسلاید 53: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيکاربردها:منشي خودکار تلفني مبتني بر گفتارتشخيص اعداد و فرامين صوتي از پشت تلفنتلفن گوياي اطلاع‌رساني سازمان‌ها با قابليت تشخيص‌گفتار

اسلاید 54: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيسيستم IVR تلفني مبتني بر گفتار براي بانک‌ ها

اسلاید 55: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينيوشا: بازشناسي گفتار تلفنيپزشک تلفني: تلفن گوياي بهداشت و قرآن با قابليت تشخيص‌ گفتار

اسلاید 56: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيبازشناسي گفتار روي PDAپارسيا-جيبي: مترجم گفتار به گفتار

اسلاید 57: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيتشخيص فرامين صوتيکاربردها:اجراکننده صوتي برنامه‌هااتوماسيون خانگي و صنعتي با به ‌كارگيري تشخيص ‌گفتارسيستم صوتي قرآن زبان گوياي فارسي براي نرم افزارهاي آفيس آموزش و بازي مبتني بر تشخيص گفتار براي کودکان

اسلاید 58: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيفرم هاي شنواپر کردن فرم هاي کامپيوتري به صورت گفتاري

اسلاید 59: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيپارسيا: مترجم گفتار به گفتارترجمه جملات و عبارات رايج مکالمات روزمره فارسي به انگليسي و عربي

اسلاید 60: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسينويسيار: تايپ هوشمند فارسي پيش بيني کلمات بعدي بصورت هوشمند در هنگام تايپ

اسلاید 61: بازشناسی گفتار (فارسي) در صنعت بانکداريمحصولات مبتني بر بازشناسي گفتار فارسيقابليت هاي نويسيار (تايپ هوشمند فارسي)تايپ سريع و آسان از طريق پيش بيني کلمات بعدي بصورت هوشمند جلوگيري از اشتباهات تايپي و املايي تکميل خودکار کلمات در حين تايپ متناسب با محتواي متن بکارگيري اطلاعات دستوري و آماري زبان فارسي سازگار با Notepad، M.S. Word™ و M.S. Outlook™سازگار با M.S. Office 2000,XP, 2003, 2007

اسلاید 62: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعکتاب‌هاS. Young, et. al., the HTKBook Version 3.2, http://htk.eng.cam.ac.uk/, 2002.X.D. Huang, A. Acero, and H. Hon, ‌Spoken language processing‌, Prentice Hall, 2000.Daniel Jurafsky, James H. Martin, SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice-Hall, 2000.Chris Manning, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press. Cambridge, May 1999.E.A. Wan, A.T. Nelson, ‌Handbook of Neural Networks for Speech Processing‌, Boston, USA, 1998.L. Rabiner, B.H. Juang, ‌Fundamentals of Speech Recognition‌, Prentice Hall, 1993.J.R. Deller, J.G. Proakis & J.H.L. Hansen, ‌Discrete-Time Processing of Speech Signals‌, Macmillan Publishing Company, 1993.

اسلاید 63: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپايان‌نامه‌‌ها و مقالاتLawrence Rabiner, Challenges in Speech in Speech Recognition and Natural Recognition and Natural Language Processing Language Processing, Lecture, SPECOM2006, June 25th, 2006. Barker, J., Coy, A., Ma, N., Cooke, M., Recent advances in speech fragment decoding techniques. In: Proc. Interspeech, pp. 85–88, 2006.B.-H. Juang and L. R. Rabiner, ‌Automatic speech recognition - A brief history of the technology development,‌ K. Brown (Ed.) Encyclopedia of Language and Linguistics, Elsevier, 2005 Sadaoki Furui, 50 Years of Progress in Speech and Speaker Recognition Research, ECTI TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY VOL.1, NO.2 NOVEMBER 2005. S. Furui, ‌Recent progress in corpus-based spontaneous speech recognition,‌ IEICE Trans. Inf. & Syst., E88-D, 3, pp. 366-375, 2005S. Furui, ‌Speech-to-text and speech-to-speech summarization of spontaneous speech,‌ IEEE Trans. Speech & Audio Processing, 12, 4, pp. 401- 408, 2004 L. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.S. Katagiri, ‌Speech pattern recognition using neural networks,‌ W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003.

اسلاید 64: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپايان‌نامه‌‌ها و مقالاتL. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.S. Katagiri, ‌Speech pattern recognition using neural networks,‌ W. Chou and B.-H. Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press, pp. 115-147, 2003. Seltzer, M. L., ‌Microphone Array Processing for Robust Speech Recognition‌, PhD Thesis, Carnegie Mellon University, Pittsburgh, PA, USA, 2003.DUSAN, S., and FLANAGAN, J., Adaptive Dialog Based upon Multimodal Language Acquisition, The Fourth IEEE International Conference on Multimodal Interfaces, Pittsburgh, PA, USA, pp. 135-140, 2002.H. G. Hirsch, D. Pearce, ‌The AURORA Experimental Framework for the Performance Evaluations of Speech Recognition Systems under Noisy Conditions‌, ISCA ITRW ASR2000, Paris, September 2000.Bazzi, I, Modeling Out-of-Vocabulary words for Robust Speech Recognition, PhD Thesis, MIT, 2000.Martin S., Liemann J., Ney H., ‌Algorithms for Bi-gram and Tri-gram Word Clustering‌, Speech Communication 24, 1998.R. P. Lippmann, ‌Speech recognition by machines and humans,‌ Speech Communication, 22,pp. 1-15, 1997.

اسلاید 65: بازشناسی گفتار (فارسي) در صنعت بانکداريمنابعپايان‌نامه‌‌ها و مقالاتP.J. Moreno, ‌Speech Recognition in Noisy Environments‌, Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania 15213, April 1996.M.J.F. Gales, P.C. Woodland, ‌Mean and Variance Adaptation within the MLLR Framework‌, Computer Speech & Language, Vol. 10, PP.249-264, 1996.M. K. Ravishankar, ‌Efficient Algorithms for Speech Recognition‌, PhD thesis, Carnegie Mellon University, 1996.M.J.F. Gales, ‌Model-Based Techniques for Noise Robust Speech Recognition‌, Ph.D. thesis, University of Cambridge, September 1995.Brown P.F., Della Pietra V.J., deSouza P.V., Lai J.C., Mercer R. L., ‌Class-Based n-gram Models of Natural Language,‌ Computational Linguistics, Vol. 18, No. 4, pp. 467-479, 1992.C. H. Lee, et. al., ‌Acoustic modeling for large vocabulary speech recognition,‌ Computer Speech and Language, 4, pp. 127-165, 1990. A. Acero, ‌Acoustical and Environmental Robustness in Automatic Speech Recognition‌, Ph.D. thesis, Camegie Mellon University, Pittsburgh, Pennsylvania, September 1990.

اسلاید 66: بازشناسی گفتار (فارسي) در صنعت بانکداريتماس با عصر گويش پردازآدرس و تلفن تهران - صندوق پستي: 1516- 13445 تلفکس: 66003710 (021)وب سايت و پست الکترونيکي www.asr-gooyesh.com info@asr-gooyesh.com

29,000 تومان

خرید پاورپوینت توسط کلیه کارت‌های شتاب امکان‌پذیر است و بلافاصله پس از خرید، لینک دانلود پاورپوینت در اختیار شما قرار خواهد گرفت.

در صورت عدم رضایت سفارش برگشت و وجه به حساب شما برگشت داده خواهد شد.

در صورت نیاز با شماره 09353405883 در واتساپ، ایتا و روبیکا تماس بگیرید.

افزودن به سبد خرید