صفحه 1:
A;
عصر عویش پرداز پرازش و بازشناسي گفتار
تکنولوژی بازشناسي گفتار فارسي
با رويكردي به صنعت بانكداري
هادى ويسى
خرداد 1388
صفحه 2:
* معرفی تکنولوژی بازشناسی گفتار
* مروري بر كاربردهاي بازشناسي گفتار
* نمایش عملي سامانه تایپ گفتاري فارسي
نویسا
/ * نمایش عملي یک سیستم دیالوگ تلفني
ویژه بانکداري
| # پرسش و پاسخ
سب
5 عصر كويش يردا ۱۷00۷۵۵ 7
سب تن 9 ‘gooyesh.com 92
صفحه 3:
A;
عصر گویشپرداز بردازشه و بازشناسي گفتار
مروري بر بازشناسي خودکار گفتار
(Automatic Speech Recognition- A Review)
aa
(ASR Gooyesh Pardaz) joy: ois por
صفحه 4:
باإشئاسى كفتار (شارسي) در صنعت بالكداري.
سيستمهاي بازشناسي خودكار كفتار-معرفي
© كفتار سادهترين و كارامدترين راه ارتباط
& هدف با زشناسي خودکار گفتار Automatic Speech
(ASR) سوت
تبدیل گفتار انسان به متن یا دستورالعمل معادل
. گفتار ميتواند یک فایل صوتي. ورودي با میکروفون,. از طریق خم
تلفن و یا فرمان از راه دور باشد.
a
| قرداد 1388
صفحه 5:
سيستمهاي بازشناسي خودکار گفتار-معرفي
:03 تم بازشناسي کامل :
* قادر به بازشناسي گفتار پیوسته و محاورهاي باشد.
7 گفتار اقراد مختلف, هتي با لهبههاي متفاوت را بازشناسي نماید.
7۳ در محيهداهاي شلوغ و نويزي هم جوابگو باشد.
7 بصورت بلادرنگ عمل کند.
7 قادر به فراگيري اطلاعات جدید نظیر کلمات. قوانین زباني و ۰۰۰ با
© سيستمهاي کاربردي امروزي:
> گفتار بايستي به صورت كتابي باشد.
* گفتار بايستي بر اساس مالت استاندارد زبان باشد و تغییرات مربوط به لهجهها منمر به
: استفاده از آنها دز محیط و شرایط نويزي منجر به اخت كارايي و دقت آنها ميشود.
* اغلب سیستم هاي كاربردي امروزي تقریبا بلادرنک هستند.
/ © سيستمهاي مومود محدود به کلمات مومود در واژگان هستند و از اطلاعات زباني و معنايي
به صورت محدود استفادة ميكنند.
سس
66.35 wwwaasts زادرب فرداد 1388 | عصر كوبش
i ~~“ gooyeshcom
صفحه 6:
کار بیجیده اي است
١ + 01000 زا ماشین آمروزه بر پایه دکمم ها و کلیدماست: نه گفتار
* اکر شما یک کلمه خاص مانند "آسمان" را 10 بار مختلف بیان نمایید. تقریبا در هيع
دو حالتي فایل هاي ضبط شده ديجيتالي آنها دقیقا یکسان نیست!
7 پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
0 میزان وابستكي یا استقلال از کوینده
۵ پیوسته یا کسسته بودن گفتار
© اندازهي واژگان
O ممدوديتهاي زباني
9 كارايي در حضور نویز و در محيهماهاي کاربردي مختلف
© ابهام آكوستيكي و میزان اشتباه بین کلمات
عصر کوش پر ۱0۳۳/۵۵ eid
سب تن 9 Seu! ‘gooyesh.com
صفحه 7:
فرداد 1390
میزان وابستگي یا استقلال از گوینده
© كوينده هاي مختلف از نظر مشخصات صداء سن, لهجه, جنس, نحوه صحبت کردن و ... با هم
متفاوتند
* وابسته به گوینده (0606006101 5063/6۲ :500): به یک و یا چند گوینده خاص پاسخ
دهد
2
٩ مستقل از گوینده (۱00606006106 506316۲ :ا5) به تمام گویندگان يك زبان پاسخ
ميدهند
روشهاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي یا استقلال از
در مورد یک سیستم بازشناسي گفتار. در مرحلهي آموزش مشخص ميشود.
بازشناسي در حالت وابسته به گوینده (بعلت محدودیت و تنوع کمتر) بالاتر از حالت مستقل از
گوینده (بعلت پیچیدگی بیشتر) است ولي نیاز به آموزش سیستم به صداي آن کاربر خاص را دارد.
٩ در کاربردهای واقعی که گوینده از ابتدا مشخص نیست سیستم را مستقل از گوینده آموزش داده
میشود و سپس هنگام استفادهبه کمک برخی رويكردها مانند تطبيق (8030]8]1011). سيستم
یرای یک گوینده خاص تطبیق میشود»
٩ در برخی کاربردهای
خاصی ندارد چون گوینده از ا:
عصر کوش پر ۱0۳۳/۵۵ 7
‘gooyesh.com از
صفحه 8:
igs 6 يا كسسته بودن كفتار
© محدوديت بر نحوة اداي كلمات توسط كوينده ميزان بيوستكي يا كسستكي كلمات
9 بازشناسي (wR: Isolated Word Recognition) lx ols
+ كفتار كلمه به كلمه و كاملاً مجزا - هر فابل صوتي يك كلمه
(Connected Word Recognition) Juaie iS wld jl, >
+ دنبألهاي از كلمات که به وسيلة سكوتي كوتاه از هم جدا شوند - هر فایل چند کلمه با سکوت در بین کلمات
* بازشناسي گفتار پیوسته كتابي (CSR: Continuous Speech Recognition)
+ كفتار به صورت ديكته كتابي و روان
° بازشناسي (Spontaneous Speech) gl eyglre ogy stat
+ كفتاريه صورت كاملاً طبيعي بيان ميشود. شامل جعلات ناقص. سرفه. تبق. مكشهاي طولاني و است.
بازشناسي كفتار بيوسته و فيالبداهه بسيار زياد است (مشكلات ناشي
مانند مشخص نبودنْ مرز os متوالي و ادغام شدن ابتداي يك كلمه با انتهاي كلمة قبلي)
© سيستمهاي pol 39 خواندن ' ن كتابي كاربردي هستند و تشخیص گفتار فيالبداهه:
يقي اه او قل تر شبات بر
fo
عصر گویش برداز .۷۷۷.۵5 1
قرداد 1388 Sante L 8 66
صفحه 9:
فرداد 1390
6 اندازهي واژگان
اژ گان یا تعداد کلمات مورد استفاده در یک سیستم بازشناسي از عوامل موثر در
دقت و سرعت سیستم است. سيستمهاي ۱۷۷/5 فقط براي تشخیص تعداد محدودي کلمه
طراحي شدهاند درحالي که بعضي دیگر از سیستمها قادرند مجموعة بزرگي از کلمات را
؟ معمولاً دقت یک سیستم بازشناسي با افزایش تعداد کلمات کم ميشود. ess
حالت کلمات شبیه به هم زیاد شده و احتمال جايگزيني یک کلمه با ديگري بب
* واژگان کوچک( ۷۵6۵0۱۱13۲۷ 6۳02۱۱): 1 تا 99 کلمه
(Medium Vocabulary) basic olf fly >
Large Vocabulary) Sy olf jy?
* واژگان خيلي
0 تا 1000 کلمه
0 تا 60000 کلمه
(Very Large Vocabulary) Sy, از 60000 کلمه
ill
عصر کوش پر ۱0۳۳/۵۵ ۳7
gooyesh com
صفحه 10:
سيستمهاي بازشناسي خود کار گفتار -پيچيدگيها
* پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
0 محدوديتهاي زباني
> اطلاعات زباني شامل دستور زبان و معنا از مهمترین اطلاعات مورد استفاده در یک سیستم
بازشت
pine 92 hj Clellbl Sly Language Model) .3bj Jae بازشناسي گفتار
اسي گفتار است
٩ اطلاعات معنايي به ندرت در این سیستمها استفاده ميشوند ولي محدودیت هاي دستوري
تقریباً در تمامي سیستم هاي بازشناسي گفتار پیوسته مورد استفاده قرار ميگیرند.
© میزان محدوديتي که توسط مدل زباني درون یک سیستم بازشناسي ایجاد مي شود. پيچيدگي
fe erplexity) آن مدل زباني نامیده ميشود که هرچه مقدار اين پيچيدگي کمتر فضاي
مورد جستجو کوچکتر ميشود.
٩ تاثیر اطلاعات زباني در تشخیص )9 درک) گفتار در سيستمهاي تشخیص گفتار امروز
اندازهاي است که ميتوان ادعا کرد که تحقق یک سیستم تشخیص گفتار با واژگان بزر"
خيلي بزرگ) با کاربرد واقعي بدون استفاده از اطلاعات زباني غیر ممکن است.
عصر گویش پرداز .۱۷۷۵۵
‘gooyesh.com a 88 6
صفحه 11:
سيستمهاي با شناسي خودکار گفتار -پيچيد گيها
كارايي در حضور نويز و در محيطاهاي كاربردي مختلف
© كارايي سيستم هاي بازشناسي كفتار با وجود اثرات مخربي جون نويزء يزواك.
تداخل و ea كه معمولاً از محيط, ميكروفن. كانال انتقال و يا صداي كوينده
sae 3 | به شدت اه مي
See.
٩ عدم حفظ كارايي سیستم در شرایط واقعي و عملي (که با نوبز همراه است)
1 .عفر کویف بردان سس[
قرداد 1388 1 لل جين يري م 1 از 66
صفحه 12:
سيستمهاي با شناسي خودکار گفتار -پيچيد گيها
معاد پيچيدگيهاي مطرح در سيستمهاي
ها كفتار
© ابهام آكوستيكي و میزان اشتباه بین کلمات
© كلماتي كه شكل نو متمايز ولي تلفظ يكسان يا شبيه به هم دارند [هم آوا]
سبب آیجاد ابهام آ کو شده و ممكن است بجاي يكديكر بازشناسي شوند
سل ee - «خواستن» و «خاستن» - «خویش» و «خیش» - «ارزه و «عرض» و
ی ی ای
© كلماتي كه شکل نوشتاري آنها به یکدیگر شباهت دارند [هم نگاره] در استخراج
مدل زباني دجار اشكال مي كنند
+ مثال: دنه و دنه - «كرد» و «كرد» - «مهر» و «مهر» - «كل» و دكل» -
ate کلمات در sl واژگان بیشتر شود: دقت مسي
i مسأله. بازشنا
زناي در سطوم RUE کیک
عصر گویش برداز .۷۷۷.۵5 5
قرداد 1388 Sante L 1۳
صفحه 13:
گفتار (فارسي) در صعت بالكداي
سيستم هاي بازشناسي خود كار كفتار - دياكرام كلي
* سیستم بازشناسي كفتار با رويكرد
تشخیص الگو
#داراي دو فاز آموزش (1۳210) و آزمون (1651)
آموزش
/ * الگوهاي مربوط به هر کلاس (واحدهاي آوايي مانند کلمه. واج و ..) با استفاده
/ از روشهايي مدلسازي ميشوند.
آزمون (استفاده)
٩ مقایسه گفتار ورودي با الگوهاي آموزش داده شده جمتشخیص واحدهاي
ايي موجود د ر گفتار ورودي
عصر گویش برداز .۷۷۷.۵5
‘gooyesh.com 88 7
صفحه 14:
فرداد 1390
گفکار (فارسي) در صخعت بالکداري
سيستمهاي بازشناسي خودکار گفتار - دیاگرام كلي
شناسي گفتار با رویکرد
aT ۱۳۷۵۵ عصر كويش يردا
2 gooyesh com
آزمون
صفحه 15:
ي) در صئعت بالكحاري.
سيستمهاي بازشناسي خودکار گفتار - تعریف اجزا
© مدلسازي آوايي
مدل كردن واحدهاي آوايِي كفتار (كلمه. هجاء سه واجي. (alo
© روش ها:
٩ مدل انطباق زماني پویا (0۲۷۷)
+ ساده و قديمي - مورد استفاده در 0121189 ۷۵/6 گوشي هاي تلفن همراه
* شبکه عصبي مصنوعي (ANN)
+ ساده و كارا. سرعت تشخيص بلادرنك. نسبتا مقاوم به نويز. فر بند آموزش زمان بر
© مدل مخفي (HMM) 595 jlo
* موققترین روبکرد. مدل کردن آماري گفتار
* مدلهاي تركيبي (ترکیب شبكههاي عصبي و /۳۱۱۸۲)
فرداد 1388 | عصرگویش برداز ۷۷۷۵ _[ 5115 66
gooyeshcom “~~ 3
صفحه 16:
(فارسي) در صئعت بالكداري
5 سيستمهاي باز شناسي خودکار کفتار- دادگان
© دادكانهاي كفتاري
۶ استفاده جهت تهیه مدلهاي آهايي
#تنوع گویندگان و حجم دادگان مهمترین پارامترهاي طراحي دادگان
MUD
دادگانهاي كاربردي زبان انگليسي شامل هدود 200 تا 300 ساعت
گفتار با هدود 300 گوینده هستند.
اين دادگان معمبلا به صورت فايلهاي صوتي با برچسپ متني
معادل در سطع واج یا کلمه هستند که گاهي داراي تقطیع در سطح
واج. کلمه یا جمله نیز هستند
سب
فرداد 1388 | عصرگویش برداز 7 ادس" 6 از 66
0
صفحه 17:
(فارسي) در صئعت بالكداري.
5 سيستمهاي باز شناسي خودکار کفتار- دادگان
استخراج اطلاعات زباني (آماري. معنايي. كرامري)
© حجم منلسب براي استخراج آمار معتبر - حدود 250 تا 300 ميليون كلمه
© استخراج خودكار كرامر زبان با استفاده از دادكانهاي يارس (tree bank) oss
© استخراج معنا از دادكان: دادكان هاي شبكه لغات يا أ 010 الا
* واژگان
* واژگان یا 6160 ]ها نیز از شامل لیست كلماتي مورد استفاده در سیستم
اسر 5
© در واژگان علاوه بر لیست خود کلمات. اطلاعات مختلفي در مورد هر کلمه مانند
امتمال وقوع آن (N-gram JLaial) obj» نقش [هاي) گرامري در جمله و ...
۱ نیز شامل ميشود. به این گونه واژگانها. واژگان محاسباتي گفته ميشود.
فرداد 1388 | عصرگویش برداز 7 ادس" 7 از 66
0
صفحه 18:
تعداد کلمات موججد در واژگان سیستم.
© تعداد کلمات خارج از دادگان مجموعه آزمون (00).
> سازگاري/عدم سازگاري دادههاي آموزش و آزمون .
محیط آكوستيكي آزمون و میزان سیکنال به نویز سیگنال گفتار
**وابسته /مستقل از گوینده
خطاهاي
(Deletion) dia loa” خطاي درج (۱856۲100) و خطاي
جايگزيني(م0نابتاناودانک)
عصر گویش برداز .۷۷۷.۵5
زد 690 Seat ‘gooyesh.com a
صفحه 19:
معيارها
تعداد كل كلمات ])
(Accuracy)es5s* |
تعداد کلمات حذف. درج و جایگزین شده
Accuratyy= Nt wv?
( Correctness) ciao
Correctnsié =. 100
کر بط ار
د
*نرخ خطاي کلمات (۷۷۶)
WER(=1- ] *NTN™ 0c
سب
فرداد 1388 | عصرگویش برداز 7 اا _ ل 9 از 66
0
صفحه 20:
شناسي گفتار از گذشته تاکنون در 5
aa.) أخير
Ke 6 1G) hep, وازگانبزرگ وازگان بزرگ Spe ony
shi ght, eo als WE ga عبتى يرالكو فوتیک و آرای
فرداد 1388 | dea dust ont هم 120 66
سيد ا 7
صفحه 21:
0.3%
2%
2.5%
6.6%
13-17%
25-29%
فرداد 1390
کاربردهاي مختلف
1 (سفر با نه
(on »
1.000
2.500
64.000
210.000
45.000
وضعیت کارايي سيستمهاي بازشناسي گفتار امروزي در
#فقار فى البوزير. | رشته اعداد بيوسته - دادگان
گفتار کتابي RM
گفتار فيالبداهه ATIS
گفتار کناب NAB/WS}
انتشار اخبار (870206250
اخبار تلويزيوني sly ۹
مکالمه تلفني
Switchboard
محاورهاي ‘witchboarc
ع+۸
عصر گویش پرداز
۷۵
66 3121
صفحه 22:
فرداد 1390
بالا بودن كاراب
3
51
امس ممح ١ موصت
re Null © ا
| عصر كوبش برداز wwwaasts
0 at
a ¥ ماشین از اسان
1
seein
;
go
1
x10
9
Crore
و Digits
ملام دوي
66 3122
صفحه 23:
واذكان تامحدوه- واذكان خیلی داذكان خيلى بزر ك-
کاوبرهایتمحدود- دی مد ویب رها مدوب
زياذهاى مختلف محيط اختاری محيط كتترل شده
TA 1 1
فرداد 1388 | dea dust ont هم 123 66
سيد ا 7
صفحه 24:
فرداد 1390
ار
وامد تمقیقات پردازش گفتار مایکروسافت
گروه گفتار دانشگاه تالا
گروه ۲7۱ دانشکاه لالم
کروه گفتار در آزمایشگاه هوش ماشین دانشگاه کمبریم
آزمایشگاه للا5 دانشگاه اورگون
آزمایشگاه 0515 دانشگاه کلرادو
کروه 65۱2 در دانشگاه جان هایکینز
کروه کفتار 105 دانشگاه برکلي
آزمایشگاه 57۵۳ در 55۱
آزمایشگاه 5۸۱1 دانشگاه كاليفرنياي جنوبي (1156)
کروه آتاب۲ در IBM
گروه 0 و آز
ایشگاه۱۱۱ از دانشگاه پنسیلوانیا
کروه 5۱5 در آزمایشگاه CSAIL دانشگاه 1/1۲
عصر كويش يردا ۱۳۷۵۵ 7
صفحه 25:
A;
عصر عویش پرداز پرازش و بازشناسي گفتار
اهمیت و كاربردهاي سیستم هاي بازشناسي خود کار گفتار
عصر گویش پرداز (۴۵۲۵52 666۷65۳ ۸5۴)
صفحه 26:
باشناسی گفتار(فارسي) در صلعت بالکداري
سيستمهاي با زشناسي خودکار گفتار - اهمیت
* زبان معمولترین رسانه ارتباطي و ابزار بازنمايي جهان
در ذهن انسان است
* گفتار ساده ترین و رایج ترین ابزار ارتباطي انسانها
است
© اولين دستاورد بازشناسي گفتار: راحتتر کردن
ارتباطات بین انسان و ماشینها
* دسترسي به تكنولوژي همواره منجر به برتري ميگرددء
برتري براي تكنولوژي بازشناسي گفتار ميتواند از ا,
مختلف فرهنگي, اجتماعي» اقتصادي, نظامي-
و علمي باشد
"تاو
| قرداد 1388 |
صفحه 27:
)در صلعت بالتداي رک
| سيستمهاي بازشناسي خودکار گفتار - اهميت
® اهمیت فرهنگي
* کمک به زبان و صیانت از بززکترین میراث فرهنكي ملت بويثه در
محيط رایانه و اینترنت
استفاده بیشتر از زبان و زنده نگه داشتن آن
“فراهم كردن بستر ايجاد تعامل بیشتر با زبان و کمک به ابعاد
توريستي. سياسي . تجاري و ..
*راحتتر كردن ارتباط اراد با زبانهاي مختلف با زبان مورد نظر (مترجم
گفتار به گفتار)
سس
فرداد 1388 | عصرگویش برداز ws 7 66
—————gooyesh.com
صفحه 28:
اي بازشناسي خود کار کفتار - اهمیت
اهمیت اجتماعي
*ایجاد آسایش و سادگي بیشتر
بالا بردن کیفیت ارائه خدمات
افزایش سرعت پاسفگويي
کسب رضایت مشتریان
کمک به معلولین
+ مثال: سیستم گزارش راديولوژي شرکت Philips زمان یک
| هفتهاي تهیه گزارش به 48 ساعت تقلیل یافته و منجر به رضایت
بيشت مشتریان. افزایش سرعت پاسخگويي و صرفه جويي قابل.
توجه در هزینه شده است.
فرداد 1390 | عصرگویش برد fa 3128 66
—————gooyesh.com
صفحه 29:
سيستمهاي بازشناسي خود کار گفتار - اهمیت ی
* اهمیت اقتصادي و تجاري:
* قابل استفاده در همه كاربردهايي که نیاز به ارتباط انسان و ماشین ومود دارد
Gal * و سادگي ب تسریع در انجام کارء
© فستكي نايذير بودن و دسترسي 24 ساعته
0 عملي كردن برخي ارتباطات غير عملي
© مثال: 1. تسريع ارتباط در سیستم ۱۷ از 2:55 دقیقه به 28 ثانيه.
2. سرعت ديكته كفتاري به طور متوسط هدود 105 كلمه در د
حاليكه سرعت متوسط تايب توسط يك فرد عادي حدود 33 كلمه در دقيقه است
* بازدهي اقتصادي و کاهش هزینه
/ * علاوه بر سازمانها و جاهاي دولتي» شركتهاي بزرگي چون ۱۱۵۴66۰۱5
فیلیپس, مایکروسافت و ... نیز جزو سرمایهگزاران آین تکنولوژي هستند. چراکه به
آینده اقتصادي آن مطمئن هستند.
فرداد 1390 | عصرگویش برد fa 3129 66
—————gooyesh.com
صفحه 30:
فرداد 1390
سینت 109 بت بر گر
ee]
عصر گویش برداز,
۷۵
صفحه 31:
(فارسي) در صلعت بالكداري
سيستمهاي بازشناسي خودکار گفتار - کاربردها
“تايب متن (نامه. كزارش و ... ).
**مکتوب کردن گفتار جلسات و سخنرانیهاء
تبدیل اخبار به متن معادل
و ... هر جايي که نیاز به تایپ نوعي متون وجود داشته باشد.
#قابل استفاده براي همه كاربران رايانه: Oly يزشكان. وكلاء
تایپیست هاء مسئولين دفتر و منشي ها و ...
عصر گویش پرداز .۱۷۷۵۵
قرداد 1388 Sante L 134 66
صفحه 32:
اي بازشناسي خودکار گفتار - کاربردها
wel See
منشيهاي تلفني (جهت متصل تما با یک فرد یا یک با
تمودن تماس گیرنده فرد بخش “(dias Cok els kG
5 اپراتور خودکار 7
سيستمهاي ۱۷۲
سيستمهاي ارتباط با مشتري 9 11/1 6,
> سيستمهاي تلفن بانك,
* سيستمهاي اطلاع رساني تلفني.
* دايركتوريهاي تلفتي با بیان نام فرد یا موسسه.
4
تعيين هويت و شناسايي كاربران
66 132 weww.asrs daa Jnl فرداد 1388 عصر
eee —————gooyesh.com
صفحه 33:
ي بازشناسي خود کار گفتار - کاربردها
مزایا
ols) “كاهش
“صرفه جوبي در هزينه
© تسهيل و تسريع ارتباط مشتريان
*امنيت بالاتر نسبت به كليد و دكمه هاي تلفن
§ Voice Aentcation
Data Warehouse
فرداد 1388 | عصرگویش برداز ۷۷۷۵ _[ 5133 66
0 از
صفحه 34:
سيستمهاي بازشناسي خودکار گفتار - کاربردها
تحقیق شرکت ۲۱۵۱۵۷ بر سیستم هاي
Te بانکها
ترمیم مي دهند با اپراتور انساني کار کنند
ترمیم مي دهند با اپراتور خودکار مبتني بر گفتار کار کنند
ترجیم مي دهند با سیستم touch-tone کار کنند
> تراکنش تلفني با گفتار 40 برایر سریع تر از cul COUCH-tone
٩ علت: حذف منوها و راهنمايي هاي مرتبط
سب
فرداد 1390 | عصرگویش برد fa 3134 66
۳
صفحه 35:
, گفتار (فارسي) در صنعت بالكداري.
سيستمهاي بازشناسي خودکار گفتار - کاربردها
2
* سیستم هاي تلفني بانكي مبتني بر گفتار
Columbia Bank®
Columbia OnCalll pine &
*شماره تماس 0050-3052253, 00502304-800-1
Standard Life Bank (UK) *
Fluency Voice Technology buss >
60 تماس ها و 3090 تعیین هویت ها با سیستم گفتاري
ABN Amro *
يكي از 20 بانک بزرگ دنیا با 3500 شعبه در 60 کشور
© در آمریکا با نام LaSalle Bank
عصر گویش پرداز .۱۷۷۷.۵5
فرداد 1388 Sante L 5135 66
صفحه 36:
) « صنعت بالکداري
هاي بازشناسي خود کار گفتار - کاربردها
* تشخیص فرامین و دستورات صوتي
* اجراي برنامه هاي رایانه با گفتن نام آنهاء کنترل لوازم خانگي با دستورات صجتي
* اتوماسیون اداري و خانگي مثلا در ساختمانهاي هوشمند ۱ 5
فرمان دادن به رباتها ۱
© فرمانهاي صوتي در خودرو
© کنترل برنامههاي كامپيوتري مثل 01666
* فرمهاي گویا براي ورود اطلاعات با فرامین صوتي
* تشخیص اعداد (متصل, پیوسته) ۱
(data entry) este! s9)9 ©
© كيوسکهاي اطلاعات
© دستگاههاي خود پرداز بانکها
ng
فرداد 1398 | عصر كوبش برداز wwwaasts
۱۳۳
صفحه 37:
اسی گفتار (فارسي) د سنعت بالکداري
سيستمهاي با شناسي خودکار گفتار - کاربردها
كاربردهاي مربوط به معلولین؛ ناشنوایان و
نابینایان
7 برقراري ارتباط معلولین هركتي و تابینایان با ماشینها و رآیانه ها
* فراهم کردن امکان استفاده از سیستم slo موجود توسط معلولین و
تابینایان (مانند سیستم هاي تلفتي خودکار)
* استفاده در سيستمهاي تبدیل گفتار به هرکات ایما و اشاره بهت
ارتباط با ناشنوایان
* معلولین, ناشنوایان و نابینایان معمولا
توانايي گويايي دارند. از این حس میتوانند
براي جبران خقدان هس هاي دیگر کمک بگیرند.
"تاو
۷۷۷.۵5. عصر گویش برداز
66 7 wiht L | 1908 sy
صفحه 38:
سيستمهاي بازشناسي خودکار گفتار - کاربردها
© كاربردهايي تركيبي
* ترجمه گفتار به GAS
**"سيستمهاي اتوماسیون اداري 9 Paper less
* سيستمهاي دیالوک و رابطها گفتاري انسان و ماشین (۳۱۱/۱)
* تشخیص درستي تلفظا براي سيستمهاي آموزش زبان
*استفاده در بازيهاي كامپيوتري جهت افزایش قابلیتهای
| جذاييتهاي آنها
| فرداد 1998 | اك aie 338 66 |
Praselatot
صفحه 39:
سيستمهاي بازشناسي خود کار گفتار - کاربردها
ساير موارد
تشخيص كفتار بر روي كامييوترهاي جيبي. تلفن همراه و ساير وسايل
Hands-free به عنوان رابط كاربر و ورود اطلاعات
جستجوگر واژههاي كليدي در گفتار (500119 ۷۷۵۲۵)
کاربردهاي تحت تحت وب مانند ۱۷/0۱667601
تصدیق و/یا تشخیص هویت گوینده براي كاربردهاي امنیتی
فرداد 1388 | عصرگویش برداز 7 ادس" 3139 66
0
صفحه 40:
بارشناس گفتار (فارسي) « صلعت باكدري
مروري بر وضعیت کاربردي بازشناسي گفتار
*مهمترین ار هاي مطرح جهاني در
بازشناسي
Nuance® م
Philips*
IBM*
Microsoft®
BBN*
Loquendo*
LumenVox *
Zz
فرداد 1388 | عصر كوبش برداز ۷۷۷۷۵۵ 1 5140 66
ري لما 2
M+
صفحه 41:
مروري بر وضعیت كاربردي بازشناسي گفتار
* مثال : سیستم دیکته مخصوص پزشکان (۱:۵۳66)
* روش کلاسیک
* هزین ي زمان صرف شده توسط پزشک جهت تهیه اسناد و گزارش بیماران
* براي هر پزشک به طور متوسط در هر سال 18000 دلار
* زمان آماده شدن گزارش (نوشتن گزارش توسط پزشک. تایپ آن توسط منشي.
تصحیح توسط پزشک و تایپ اصلاحات)
* حداقل 48 ساعت
روش استفاده از سیستم دراگون (نسفه و)
* هزینه فوق - بین 899 تا 1.039 دلار
یبا همزمان با Oly گفتار و در زمان گزارش گيري
* زمان آماده شدن گزارش - ت:
(حداکثر 12 ساعت)
# صرفهجويي در زمان و کاهش هزینه به میزان 9060 *
7 ۳۳۷۵۵ aps usd nt
3 ae
صفحه 42:
A;
عصر عویش پرداز پرازش و بازشناسي گفتار
بازشناسي خودکار گفتار زبان فارسي
عصر گویش پرداز (۴۵۲۵52 666۷65۳ ۸5۴)
صفحه 43:
* شرکت عصرگویش پرداز (سهامي خاص)
* شروع فعالیت: ۰1381 ثبت : مرداد 1384
* اولین و تنها شرکت ايراني خعال در زمینه پردازش و تشخیص گفتار
۴ هدف: طراهي و توسعه نرم افزارها و سختاغزارهاي مبتتي بر گفتار (به ویژه براي
زبان فارسي)
7/ * زمينههاي تخصصي:
© يردازش سيكنال
© تشخيص كفتار (تبديل كفتار به متن)
* سنتز گفتار (تبدیل متن به گفتار)
* طراهي دادگانهاي گفتاري
© پردازش زبان طبيعي
* بهبود کیفیت گفتار
فرداد 1390
عصر گویش alae
۷۵
43ر66
صفحه 44:
نويسا؛ نرواخزار ديكتة كفتاري براي زبان فارسي
* نیوشا؛ تشخیص گفتار تلفتي
٩ منشي خودکار تلفني مبتني بر گفتار . تشخیص اعداد و فرامین صوتي از پشت تلفن» سیستم
هاي ۱۷8 تلفني ميتني بر گفتار
"* جستجوکر واژههاي كليدي در گفتار
پارسیا؛ مترجم صوتي گفتار به گفتار
هوشمند فارسي
تشفیص گفتار در کامپيوترهاي کوچك (تلفنهمراه, PDA 49(
٩ پارسیا جيبي(مترجم صوتي-نسخه کامپیوتر هاي جيبي) و اجرا کننده صوتي برنامهها
فرداد 1390 | عصرگویش برد fa 5144 66
—————gooyesh.com
صفحه 45:
(فارسي) در صئعت بالكداري
سیستم تشخیص كفتار فارسي نويسا
© نويسا
© موتور تشخيص كفتار ييوسته مستقل از كوينده با وازكان بزرك زبان فارسي
lags شركت عصر كويش يرداز
بر ۲۱۳۸۲ با مدلسازي واج و سه واجي.
٩ استفاده از رایجترین ايدههاي مقاومسازي و تطبیق گوینده
٩ استفاده روشهاي مدلهاي آماري و گرامري
٩ قابلیت استخراج محصولات مختلف
انويسا: نوم افزر تایپ گفتاري
نیوشا: تشخیص گفتارتلفني
جستجوي کلمات کليدي در کفتار
تشخیص فرامین و دستورات صوتي
فرداد 1388 | عصرگویش برداز fa کد از 66
—————gooyesh.com ار
صفحه 46:
در صنعت بانکداري
تشخیص كفتار فارسي نویسا
*نویسا: نرم افزار تایپ گفتاري فارسي
با خواندن متن آنرا تایپ نمایید
فرداد 1388 | عصر كوبش برداز و۷۷۷۵ 6 از 66
0 7
صفحه 47:
.باإشناسى كفتار (فارسي) در ghey cat
سيستم تشخيص كفتار فارسي نويسا
© قابليت هاي نويسا (نايب كفتاري فارسي)
* دقت تشخیص بسیار بالا (مدود 45:95
2
تایپ سریع متون همزمان با صحبت کوینده Bra
+ امكان نوشتن در همه محيط هاي تايب o Sos
© نرمافزارهاي اتوماسیون. ۱۷076, محيطهاي تهیه ایمیل و ... ورن $<
? قابلیت تایپ علائم نارشي مانند نقطه. علامت سوال و... با گفتار oye
قابلیت تلیپ اعداد بهصورت عددي یا هروفي
ايجاد يروفايل شخصي براي هر كوينده
قابليت آموزش به صداي كاربران و يادكيري لهجه و لحن بيان كوينده
شامل تمامي لغات يركاربرد زبان فارسي (حدود 21 هزار كلمه)
امكان افزودن كلمه جديد به واژگان کاربر در نرمافزار
قابلیت تطبیق به انشاي کاربر توسط تیم پشتيباني شرکت عصرکویشپرداز
فرداد ۱380
نا
صفحه 48:
7 مزاياي نویسا (تایپ گفتاري فارسي)
4 اغزایش سرعت تایپ و ورود اطلاعات
© ديكته كفتاري- به طور متوسط حدود 105 كلمه در دقيقه.
© سرعت متوسط تايب توسط يك فرد عادي- حدود 33 كلمه در دقيقه
* صرفهجويي در زمان
+
کاهش هزینه ها
4 حفظ امنیت اطلاعات در هنگام ورود دادهها
4
قرداد 1388
جلوكيري از اشتباهات املايي
عصر كويش برداز
۷۵
6 548
صفحه 49:
(فارسي) در صئعت بالكداري
سيستم تشخيص كفتار فارسي نويسا
* كاربردهاي نویسا:
7 تایپ هرگونه متوني که مستلزم تایپ با صفحه کلید هستند:
نامه هاي اداري یا شخصي
۵ پاراف نامه ها
© تايب كزارش
٩ تایپ متون شخصي (یادداشت هاء وبلاك هاء مقالات و ...)
6549 “Lwin ast: عصركويش يريا | ane
2 9
صفحه 50:
برخي از مشتريان نويسا
قرداد 1388
بانکها (تجارت, ملت, پارسیان, سامان, سرمایه)
مجلس شوراي اسلامي ایران (بقش انفورماتیک)
سازمان [ندانهاي کل wis
سازمان توسعه تجارت ايران.
سازمان نظام پرستاري
سازمان بازرسي کشور
سازمان صنایع و معادن (ستاد تمول اقتصادي)
سازمان جهاد کشاورزي
سازمان صدا و سيماي جمهوري اسلامي ایران (مرکز ت
وزارت دفاع
ستاد مشتری سپاه پاسداران انقلاب gallo!
نیرهی زميتي ارتش
قرارگاه هاتم الانبیاء
بنیاد تعاون ناجا
نيروي مقاومت بسيع
شرکت (ملي پالایش و پخش فرآوردههاي نفتي. فولاد مبارکه. بیمه البرز. نفت فلات قاره و)
دانشگاه (ستعتي شریف. مالک اشتر. امام مسیم(ع)» دانشگاه آزاد اسامي (واهدیزد قايم شهر))
بالايشكاه (آبادان. بالايشكاه تهران)
006
دانشکده)
66 3150
صفحه 51:
در صعت بالکداري
محصولات مبتني بر بازشناسي گفتار فارسي
تهیه گزارش هاي پزشکان به صورت گفتاري
٩ راديولوژي
cr?
MRI ©
Le
سس دمع
رصع( لا
فرداد 1388 | عصرگویش برداز 7 اا _ ل از 66
0
صفحه 52:
(فارسي) در صئعت بالكداري
محصولات مبتني بر بازشناسي كفتار فارسي
® جستجوكر كلمات كليدي در كفتار
“كاربردهاء
© استخراج و طبقهبندي اطلاعات گفتاري
٩ شنود و رديابي مكالمههاي تلفني
ZS Keyword Spotter
File Settings Help
Open
Spot i
Close
Ext
66 5152 ۷۷۷۵۵ gla vies yee | 1388 فرداد
3 ~~“ gooyeshcom
صفحه 53:
بارشناسی گفتار (فارسي) د« صنعت بانكداري
محصولات مبتني بر بازشناسي گفتار فارسي
* نیوشا: بازشناسي گفتار تلفني
* کاربردها:
* منشي خودکار تلفني مبتني بر گفتار
* تشفیص اعداد و فرامین صوتي از يشت تلفن
تلفن گوياي اطلاعرساني سازمانها با قابلیت تشفیصگفتار
gute خودكار تفدى تق
فد کر
20000
ع 1
صفحه 54:
بازشناسی گفتار (غارسي) در صلعت nS
محصولات مبتني بر بازشناسي گفتار فارسي
* نيوشا: باز
تم ۱۷ تلفني
3
0
باك صادرت sone
مورتضف
بردت قض
قص برق
قصرات
قص كار
قص تلن
alas
| 9ه اسن gh عصرگویش | eee
ees gooyeshtom 7 ۱
صفحه 55:
محصولات مبتني بر بازشناسي گفتار فارسي
صفحه 56:
اسی گفتار (فارسي) در سلعت بالکداري
محصولات مبتني بر بازشناسي گفتار فارسي
7 بازشناسي گفتار روي ۳۵۸
> پارسیا-ميبي: مترجم گفتار به گفتار
حت
Os ۲ یمان @Wéndsh
Sie em co
1 ۲ گویش پردا ast: 1
عصر پرداز www.ast>
see sins | ا 55 سس 156 66
صفحه 57:
2
ات مبتني بر بازشناسي گفتار فارسي
* کاربردها:
٩ اجراکننده صوتي برنامهها
© اتوماسیون خانگي و صنعتي با به کلر گيري تشخیص گفتار
* سیستم صوتي قرآن
* زبان گويلي فارسي براي نرم افزارهلي آفیس
٩ آموزش و بازي مبتني بر تشخیص گفتار پراي کودکان
فرداد 1388 | عصرگویش پرداز ۷۷۷۵۵ 27
كر
صفحه 58:
1 ) كفتاز (فارسي) در صئعت بانكداري
محصولات مبتني بر بازشناسي كفتار فارسي
فرم هاي شنوا
* پر کردن فرم هاي كامييوتري به صورت كفتاري
قرداد 1388
صفحه 59:
بازشناسی گفتار (فارسي) در صنعت بانکداري.
۱
2 ie —_ \
١ #پارسیا: مترجم گفتار به گفتار
\ * ترجمه جملات و عبارات رایم مکالمات روزمره فارسي به انگليسي و عربي
مرجم موت ارسي
www.
sins | 66و | عصر كويش برداز past
4 قزداء ناا 1 ~gooyesh.com:
صفحه 60:
7 نویسیار: تایپ هوشمند فارسي
> پیش ني کلمات بعدي بصورت هوشمند در هنگام تایپ
فرداد 1390
صفحه 61:
, گفتار (فارسي) در صنعت بالكداري.
محصولات مبتني بر بازشناسي گفتار فارسي
* قابلیت هاي نویسیار (تایپ هوشمند فارسي)
* تایپ سریع و آسان از طریق پیش بيني کلمات بعدي بصورت هوشمند
* جلوگيري از اشتباهات تايپي و املايي
* تکمیل خودکار کلمات در مین تايب متناسب با محتواي متن
* بكارگيري اطلاعات دستوري و آماري زبان فارسي
* سازگار با ™M.S. Outlook 9 ™ Notepad. M.S. Word
M.S. Office 2000,XP, 2003, 2007 b y5ju» *
بازیکنان تیم ملی ج وهیر.__ اسلامی ۱ در رقابتهای جام چ
ws] 0 a
oad wil =]
| اه | اضمار
7 ۷۷۷.۵5۰ ... عصر گویش پرداز
66161 Fie ۱ 1886 قرداد
صفحه 62:
1 S. Young, et. al., the HTKBook Version 3.2,
hitp://htk.eng.cam.ac.uk/, 2
5 كتابها
2. X.D. Huang, A. Acero, and H. Hon, Spoken language processing,
Prentice Heil, 2000. ۳ اف
3. Daniel Jurafsky, James H. Martin, SPEECH and LANGUAGE
PROCESSING: An introduction to Natural Language Processing, Computational Linguistics, and
‘Speech Recognition, Prentice-Hall, 2000.
4. Chris Manning, Hinrich Schitze, Foundations of Statistical Natural
Language Processing, MIT Press. Cambridge, May 1999.
5. E.A. Wan, A.T. Nelson, Handbook of Neural Networks for Speech
Processing, Boston, USA, 1998.
6. _L. Rabiner, B.H. Juang, Fundamentals of Speech Recognition,
Prentice Hall, 1993. /
7. J.R. Deller, J.G. Proakis & J.H.L. Hansen, Discrete-Time Processing of
Speech Signals, Macmillan Publishing Company, 1993.
66 162 ws فرداد 1388 | عصرگویش برداز
if —————gooyesh.com
صفحه 63:
* پایاننامهها و مقالات
Lawrence Rabiner, Challenges in Speech in Speech Recogriition and Natural
Recognition and Natural Language Processing Language Processing, Lecture,
۱۸۳2006, June 25th, 2006.
Barker, J. Coy, A. Ma, N. Cooke, M., Recent advances in speech fragment
decoding'techniques. In: Proc. Interspeech, pp. 85-88, 2006.
B.-H. Juang and L. R. Rabiner, Automatic speech recognition - A brief history of the.
technology development, K. Brown (Ed.) Encyclopedia of Language and
Linguistics, Elsevier, 2005
SPEC
Sadaoki Furui, 50 years of Progress in Speach and Speaker Recognition Research,
ECT] TRANSACTIONS ON COMPUTER AND INFORMATION TECHNOLOGY VOL.1,
NO.2 NOVEMBER 2005.
$. Furui, Recent progress in corpus-based spontaneous speech recognition, IEICE
Trans. Inf. & Syst., EB8-D, 3, pp. 366-375, 2005
S. Furui, Speech-to-text and speech-to-speech summarization of spontaneous
Speech, IEEE Trans. Speech & Audio Processing, 12, 4, pp. 401- 408, 2004
L. R. Rabiner and B. H. Juang, Statistical Methods for the Recognition and
Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.
S. Katagir, Speech pattern recognition using neural networks, W. Chou. and B.-H.
-ds,) Pattern Recognition in Speech and Language Processing, CRC Press,
ian
pp. 1a5-147,"2003
فرداد 1388 1 عصر گویش برداز, 63 از 66
صفحه 64:
© پایاننامهها و مقالات
R. Rabiner and 8. H. Juang, Statistical Methods for the Recognition and ۱
Understanding of Speech, Encyclopedia of Language and Linguistics, 2004.
S. Katagiri, Speech pattern recognition using neural networks, W. Chou and BH.
Juang (Eds.) Pattern Recognition in Speech and Language Processing, CRC Press,
pp. 115-147, 2003.
Seltzer, M. L., Microphone Array Processing for Robust Speech Recognition, PhD
Thesis, Carnegie Mellon University, Pittsburgh, PA, USA, 2003.
DUSAN, S., and FLANAGAN, J., Adaptive Dialog Based upon Multimodal Language
Acquisition, The Fourth IEEE international Conference on Multimodal interfaces,
Pittsburgh, PA, USA, pp. 135-140, 2002.
H.G. Hirsch, 0۰ Pearce, The AURORA Experimental Framework for the
Performance Evaluations of Speech Recognition Systems under Noisy
Conditions, ISCA ITRW ASR2000, Paris, September 2000.
Bazzi, |, Modeling Out-of Vocabulary words for Robust Speech Recognition, PhD \
Thesis, MIT, 2000.
Martin S., Liemann J., Ney H., Algorithms for Bi-gram and Tri-gram Word /
Clustering, Speech Communication 24, 1998.
R. P. Lippmann, Speech recognition by machines and humans, Speech
Communication, 22,pp. 1-15, 1997.
فرداد 1388 5164 66
صفحه 65:
e MLLR
پایاننامهها و مقالات
BJ. Moreno, Speech Recognition in Noisy Environments, Ph.D, thesis,
Camegie Mellon University, Pittsburgh, Pennsylvania 15213, April 1996.
MF. Gales, P.C. Woodland, Mean and Variance Adaptation within th
Framework, Computer Speech & Language, Vol. 10, PP.249-264, 1996.
thesis,
M. K. Ravishankar, Efficient Algorithms for Speech Recognition, PhD.
Carnegie Mellon University, 1996.
MJ.F. Gales, Model-Based Techniques for Noise Robust Speech Recognition,
C., Mercer R. L., Class-Based
Ph.D. thesis, University of Cambridge, September 1995.
Brown PF., Della Pietra VJ., deSouza Pv., Lai
n-gram Models of Natural Language, Computational Linguistics, Vol. 18, No.
4, pp. 467-479, 1992.
CH. Lee, et. al., Acoustic modeling for large vocabulary speech,
recognition, Computer Speech and Language, 4, pp. 127-165, 1990.
‘A. Acero, Acoustical and Environmental Robustness in Automatic Speech
Recognition, Ph.D. thesis, Camegie Mellon University, Pittsburgh,
Pennsylvania, September 1990.
فرداد 1390
66 3165
صفحه 66:
اس با عصر گویش پرداز
۲ * آدرس و تلفن
* تهران - صندوق پستي: 1516- 13445
* تلفکس: 66003710 (021)
ا وب سايت و يست الكترونيكي
www.asr-gooyesh.com * f
info@asr-gooyesh.com * |
سب
فرداد 1388 | عصرگویش برداز 7 ادس" 5166 66
0