صفحه 1:
رام
دانشكاه ييام نور كنبد كاوس
صفحه 2:
مقدمه ای بر بردازش
زبان طبيعي
صفحه 3:
#هوش مصنوعي
*پردازش زبان طبيعي
گتاریخچه )راا)
*کاربرد هاي ظر()
صفحه 4:
؟نحوه پردازش فکر را در ماشین نشان
مي دهد
5۰ 0
ARTIFICIAL INTELLIGENCE
صفحه 5:
#ساخت ماشین هاي هوشمندتر (هدف اولیه)
#ساخت ماشین هاي مفیدتر (هدف کاربردي)
صفحه 6:
*يادگيري يا از طریق تجربه
گرفع ابهام
استفاده از استدلال براي حل مسائل
صفحه 7:
© دليلي ندارد که جوابها مشابه با
* ممكن است جوابها هم اشتباه باشند.
صفحه 8:
سیستم هاي خبره
؟ پردازش زبان طبيعي
9 پردازش گفتار
؟ رباتیک
۴ بینایی ماشین
صفحه 9:
re ee eee er
استفاده از آن مي نوبسیم و صحبت مي
SO gey ely) leer een care زان
*ممکن است که قرم گفتاری و نوشتاري زبان ن ها متفات باشند
و همچنین از هم مستقل بآشند.
۶ سیستم هايي از وا اژگان قواند و معاني که مي توانند ثبت
ومشاهده شوند وجود دارند
صفحه 10:
در ایتباط با توسعه مدلهاي محاسباتي, از دیدگام
پردازشزبانمي باشد.
- خواندن و تفسیر یک کتاب درسي
صفحه 11:
طبيعي به عنوان ورودي و خروجي استفاده نمایند.
language, سب computer — language
understanding-—————
(NLU)
generation —-
(NLG)
صفحه 12:
0
صفحه 13:
* كاربرد کامپیوتر ها براي مطالعه علمي زبان انسان
© مطالعه در زمينه اينكه انسان ها جطور زبان را توليد كرده و مي فهمند
* در زمينه زبان شناسي توليدي و قبل ازآن شامل مطالعه زبان رسمي و
زبان هاي برنامه نويسي مي شد.
* كامبيوتر به عنوان يك ابزار در مدل هايي که قابلیت توسعه و ارزيابي
دارند. استفاده مي شد . به عنوان مثال
پیاده سازي تتوري "يادگيري زبان توسط نوزاد"
صفحه 14:
وین برنامه تامل تشحيص لیب سم جستجوی لعت در
لغت بودکه در a 1 در دی دراسال 1948
ایجاد شد.
:1970 Ls 1957 3| NLP
مبتني بر گرامر:
استفاده از فرمال گرامر به عنوان 0-0 بان و سيستمهاي يادگيري
farris, Kai Peis د 0
صفحه 15:
مدلهاي آماري:
استفاده از روشهاي احتمالاتي براي بازشناسی گفتار
(Fodor, Bever, Garrett, Bresnan, Weinberg)
اولین مدل فيزيکي-زباني قابل تست براي يادگيري زبان و فهم آن پیشنهاد
صفحه 16:
# استفاده از شبکه هاي (۸۲
:Case Grammar ®
حل يکي از مسائل از ترجمه ماشيني
تثوري وابستگي معنايي.که تلوريي دربیان زبان درواژه
هاي اوليه معنابي است راراه دادد.
ریه مفاهیم رویه اي براي عمل كردن به
عنوان یک تاج مياني بين يك سيستم بردازش | زبا 2
صفحه 17:
SHRDIU ®
LUT ‘LUNAR ® یکسیستم ولسط پایگاه دادم که از مفاهیمرویه لي
و 1 لستفاده می کرد.
LIFER/LADDER ® کی Nei eee ae
که به عنلنیکولسط زبازطبیعی بولي یکپایگام دادم از
لطاهاتدر بایم كشتي هاي اتش [مريكا طولحي شده بود.
صفحه 18:
:1990 Ls 1980 ;|; NLP®
(Grammar Formalisms) ,, yf -
Je Ls 1990 ||; NLP®
چند زباني وچندبعدي -
(Multilinguality and Multimodalityy
صفحه 19:
؟ کاربرد ها مي توانند به راه هاي مختلفي دسته بندي شوندبه
عنوان مثال: وسیلهابعد.عمی تحلیلها درجه تعاملات.
- کاربرد هاي بر پایه متن.
- فهم زبان طبيعي.
- سیستم هاي مکالمه.
صفحه 20:
- یافتن سند مناسب در عنوان هاي مشخص از یک پایگاه دادم
- استخراج اطلاعات از پیام ها مقالات.صفحات وب و ...
- ترجمه سند از یک زبان به زبان دیگر.
* نکته: همه این کاربرد ها نیازمند لا( نیستند.
تکنیک هایی که بر پایه کلمات كليد. هستند مي توانند براي
صفحه 21:
"برای من بيدا كن همه مقالات در رابطه تصاد فات ما
از دو ماشین در Malta در نیمه اول 2001
اینجا سیستم باید اطلاعات کافی را براي مشخص کردن اینکه آیا مقاله ها ملاک
تعریف شده اي به وسیله پرسش معرفي مي کنند. استخرا
صفحه 22:
وانسان
سیستم پردازش پایگاه NL colo
سرویس هاي مشتري خودکار مثل سرویس هاي بانكي
سیستم حل مسئله ,1 Gi
برخي از تفاوت هاي سيستم هاي متني و مکالمه اي:
زبان هاي استفاده شده زياد رسمي نيستند
استفاده از شرح تصديق هاي زير مكالمه ۱
صفحه 23:
صفحه 24:
بان گفتاري شناسايي مي شود و مثلا در سيستمهاي دیکته به
متن ءيا در سيستم هاي كنترل » به فرامينء يا به بازنمود
دروني ديكري ٠ تبديل مي شود.
صفحه 25:
*اداها (عسه1(0)) در زبان گفتاری از متن (سیستم های
متن - به - گفتار ) یا از بازنمودهاي درونی لغات یا جملات
( سیستم هاي مفهوم - به - گفتار) تولید مي شوند.
صفحه 26:
؟ این تكنولوژي متون را به مقولات اختصاص مي دهد. متون
ممکن است به بیش از یک مقوله متعلق باشند. مقوله ها
ممکن است حاوي مقولات ديگري باشند.تصفیه سازي حالت
Seong ee ل لت
صفحه 27:
*مربوط ترین بخش هاي یک متن به صورت خلاصه استخراج
مي شوند . اين کار به طول و درازاي مورد نیاز خلاصه ها
بستگي دارد. در صورتي که لازم باشد که خلاصه به یک
پرسش معین مختص باشد . تلخیص سخت تر است.
صفحه 28:
* به عنوان يبش شرطي براي بازيابي سند . متون در یک
پایگاه داده اي نمایه سازی شده ذخیره می شوند. معمولا
متن براي همة شكلهاي كلمه يا - بعد از شرح و تفسير براي
GLAS dow نمایه مي شود. كاهي اوقات نمايه سازي با مقوله
بندي و تلخيص تركيب مي شود .
صفحه 29:
متون از یک پایگاه داده اي که بیشتر با یک پرسش يا سند
بازيابي مي شوند . اسناد مورد نظر
با توجه به مناسبت مورد انتظارشان مرتب مي شوند . نمایه
سازي, مقوله بندي, تلخیص و بازيابي اغلب تحت اصطلاح
بازيابي اطلاعات قرار مي گيرند. . .
معین مطابقت مي کند .
صفحه 30:
تکه ۹ اطلاعاتي مربوط ومناسب اطلاعات كشف و براي
استحراج نشان ن دار مي شوند: : قطعات استخراج شده مي توانند
به شکل هاي ذیل باشند: موضوع ۰ هویت هاي با نام از قبیل
اسامي شرکت ۰ مکان یا شخص . رابطه هاي ساده از قبیل
قیمتها . مقاصد. کارکردها و یا ربطه هاي پیچیده ازقبیل شرح
دادن ا شرمکس وا با مسا یقات | فو تال"
صفحه 31:
* قطعات استخراج شده اطلاعات از چندین منبع در یک
پایگاه داده اي ترکیب مي شوند. ممکن است مناسباتي که از
قبل تشخیص داده نشده اند , کشف شوند.
صفحه 32:
پرسشهاي زب بان طبيعي براي دسترسي به اطلاعات در پایگاه
داده اي مورد استفاده قرار مي ود پایگاه داده اي ممکن
eles coal داد های تسا خعار ی شده با محرن ی از عون
دیجیتال باشد که در تن بخش هاي معین به عنوان پاسخ
هاي بالقوه نشان دار شده اند.
صفحه 33:
ت Ooo زبان طبيعي ایجاد مي شود که محتواي اساسي
پایگاه داده اي یا تغییرات آن را شرح مي دهد. گزارش مي
تواند حاوي اعداد جمع شده . حداکش حداقل و بنيادي
ترین تغییرات باشد.
صفحه 34:
؟تكنولوژي هايي که متون را ترجمه مي کنند يا به مترجمان
کمک مي کنند . ترجمه خودکا ریا ترجمه ماشيني خوانده
مي شود . حافظه cle ترجمه از مقادیر بزرگي متن همراه با
ترجمه هاي موجود براي دنبال کردن موثر ترجمه هاي
احتمالی کلمات » عبارات و جملات استفاده می کنند.
صفحه 35:
Output
summary
signal in language 2
answer to query
relevant documents
computer instructions
Input
“document(s)” (CNN broadcasts)
signal in language 1
query
query
command in natural language
Task
summarization
machine translation
question answering
— information retrieval
user interfaces
صفحه 36:
طبقه بندي زبانهاي جهان
ببانهای آریانی (هندواروبایی 1800-570۳68۳ [نواد سپید]
Ganskrit ) Avesticy 2 SL / aly!
بهلوی FEED بارسى»
لماک wel رن
es sa} tthe] cael ی
hake) Tek 4
اردو As]
possi آکجراتی Je,
esl
لری a FAIA]
sil
صفحه 37:
زبانهای سامی (50106110) |نواد خاکستری)؛
امى شمالى سامی جنوبی
اکدی el
|سریانی ee] PL esa
هه هم ها
+
صفحه 38:
4
اسکاندیناوی
silat >| یژیرن
صفحه 39:
|کرهای
ey
بندی زبانهاي جهان
ازبانهای چینی -تبتی sip} (Sino-Tibetan) 235{
آسیای شرقی اورال-آلتایی
SI ah} |قرغیزی
ene] قزاقى ارینوزی
صفحه 40:
امین مارامائي
دنت نشجوی رشته ۳۳
