کامپیوتر و IT و اینترنتعلوم مهندسی

مقدمه ای بر پردازش زبان طبيعی (NLP)

صفحه 1:
رام دانشكاه ييام نور كنبد كاوس

صفحه 2:
مقدمه ای بر بردازش زبان طبيعي

صفحه 3:
#هوش مصنوعي *پردازش زبان طبيعي گتاریخچه )راا) *کاربرد هاي ظر()

صفحه 4:
؟نحوه پردازش فکر را در ماشین نشان مي دهد 5۰ 0 ARTIFICIAL INTELLIGENCE

صفحه 5:
#ساخت ماشین هاي هوشمندتر (هدف اولیه) #ساخت ماشین هاي مفیدتر (هدف کاربردي)

صفحه 6:
*يادگيري يا از طریق تجربه گرفع ابهام استفاده از استدلال براي حل مسائل

صفحه 7:
© دليلي ندارد که جوابها مشابه با * ممكن است جوابها هم اشتباه باشند.

صفحه 8:
سیستم هاي خبره ؟ پردازش زبان طبيعي 9 پردازش گفتار ؟ رباتیک ۴ بینایی ماشین

صفحه 9:
re ee eee er ‏استفاده از آن مي نوبسیم و صحبت مي‎ SO gey ely) leer een care ‏زان‎ ‏*ممکن است که قرم گفتاری و نوشتاري زبان ن ها متفات باشند‎ ‏و همچنین از هم مستقل بآشند.‎ ۶ سیستم هايي از وا اژگان قواند و معاني که مي توانند ثبت ومشاهده شوند وجود دارند

صفحه 10:
در ایتباط با توسعه مدل‌هاي محاسباتي, از دیدگام پردازش‌زبانمي باشد. - خواندن و تفسیر یک کتاب درسي

صفحه 11:
طبيعي به عنوان ورودي و خروجي استفاده نمایند. language, ‏سب‎ computer — language understanding-————— (NLU) generation —- (NLG)

صفحه 12:
0

صفحه 13:
* كاربرد کامپیوتر ها براي مطالعه علمي زبان انسان © مطالعه در زمينه اينكه انسان ها جطور زبان را توليد كرده و مي فهمند * در زمينه زبان شناسي توليدي و قبل ازآن شامل مطالعه زبان رسمي و زبان هاي برنامه نويسي مي شد. * كامبيوتر به عنوان يك ابزار در مدل هايي که قابلیت توسعه و ارزيابي دارند. استفاده مي شد . به عنوان مثال پیاده سازي تتوري "يادگيري زبان توسط نوزاد"

صفحه 14:
وین برنامه تامل تشحيص لیب سم جستجوی لعت در لغت بودکه در ‎a‏ 1 در دی دراسال 1948 ایجاد شد. :1970 Ls 1957 3| NLP مبتني بر گرامر: استفاده از فرمال گرامر به عنوان 0-0 بان و سيستمهاي يادگيري ‎farris, Kai Peis‏ د 0

صفحه 15:
مدلهاي آماري: استفاده از روشهاي احتمالاتي براي بازشناسی گفتار ‎(Fodor, Bever, Garrett, Bresnan, Weinberg)‏ اولین مدل فيزيکي-زباني قابل تست براي يادگيري زبان و فهم آن پیشنهاد

صفحه 16:
# استفاده از شبکه هاي (۸۲ ‎:Case Grammar ®‏ حل يکي از مسائل از ترجمه ماشيني تثوري وابستگي معنايي.که تلوريي دربیان زبان درواژه هاي اوليه معنابي است راراه دادد. ‏ ریه مفاهیم رویه اي براي عمل كردن به عنوان یک تاج مياني بين يك سيستم بردازش | زبا 2

صفحه 17:
SHRDIU ® ‎LUT ‘LUNAR ®‏ یکسیستم ولسط پایگاه دادم که از مفاهیم‌رویه لي و 1 لستفاده می کرد. ‎LIFER/LADDER ®‏ کی ‎Nei eee ae‏ که به عنلن‌یکولسط زبازطبیعی بولي یک‌پایگام دادم از لطاهاتدر بایم كشتي هاي اتش [مريكا طولحي شده بود. ‎

صفحه 18:
:1990 Ls 1980 ;|; NLP® (Grammar Formalisms) ,, yf - Je Ls 1990 ||; NLP® ‏چند زباني وچندبعدي‎ - (Multilinguality and Multimodalityy

صفحه 19:
؟ کاربرد ها مي توانند به راه هاي مختلفي دسته بندي شوندبه عنوان مثال: وسیلهابعد.عمی تحلیلها درجه تعاملات. - کاربرد هاي بر پایه متن. - فهم زبان طبيعي. - سیستم هاي مکالمه.

صفحه 20:
- یافتن سند مناسب در عنوان هاي مشخص از یک پایگاه دادم - استخراج اطلاعات از پیام ها مقالات.صفحات وب و ... - ترجمه سند از یک زبان به زبان دیگر. * نکته: همه این کاربرد ها نیازمند لا( نیستند. تکنیک هایی که بر پایه کلمات كليد. هستند مي توانند براي

صفحه 21:
"برای من بيدا كن همه مقالات در رابطه تصاد فات ما از دو ماشین در ‎Malta‏ در نیمه اول 2001 اینجا سیستم باید اطلاعات کافی را براي مشخص کردن اینکه آیا مقاله ها ملاک تعریف شده اي به وسیله پرسش معرفي مي کنند. استخرا

صفحه 22:
وانسان سیستم پردازش پایگاه ‎NL colo‏ سرویس هاي مشتري خودکار مثل سرویس هاي بانكي سیستم حل مسئله ,1 ‎Gi‏ برخي از تفاوت هاي سيستم هاي متني و مکالمه اي: زبان هاي استفاده شده زياد رسمي نيستند استفاده از شرح تصديق هاي زير مكالمه ۱

صفحه 23:

صفحه 24:
بان گفتاري شناسايي مي شود و مثلا در سيستمهاي دیکته ‏ به متن ءيا در سيستم هاي كنترل » به فرامينء يا به بازنمود دروني ديكري ‎٠‏ تبديل مي شود.

صفحه 25:
*اداها (عسه1(0)) در زبان گفتاری از متن (سیستم های متن - به - گفتار ) یا از بازنمودهاي درونی لغات یا جملات ( سیستم هاي مفهوم - به - گفتار) تولید مي شوند.

صفحه 26:
؟ این تكنولوژي متون را به مقولات اختصاص مي دهد. متون ممکن است به بیش از یک مقوله متعلق باشند. مقوله ها ممکن است حاوي مقولات ديگري باشند.تصفیه سازي حالت ‎Seong ee‏ ل لت

صفحه 27:
*مربوط ترین بخش هاي یک متن به صورت خلاصه استخراج مي شوند . اين کار به طول و درازاي مورد نیاز خلاصه ها بستگي دارد. در صورتي که لازم باشد که خلاصه به یک پرسش معین مختص باشد . تلخیص سخت تر است.

صفحه 28:
* به عنوان يبش شرطي براي بازيابي سند . متون در یک پایگاه داده اي نمایه سازی شده ذخیره می شوند. معمولا متن براي همة شكلهاي كلمه يا - بعد از شرح و تفسير براي ‎GLAS dow‏ نمایه مي شود. كاهي اوقات نمايه سازي با مقوله بندي و تلخيص تركيب مي شود .

صفحه 29:
متون از یک پایگاه داده اي که بیشتر با یک پرسش يا سند بازيابي مي شوند . اسناد مورد نظر با توجه به مناسبت مورد انتظارشان مرتب مي شوند . نمایه سازي, مقوله بندي, تلخیص و بازيابي اغلب تحت اصطلاح بازيابي اطلاعات قرار مي گيرند. . . معین مطابقت مي کند .

صفحه 30:
تکه ۹ اطلاعاتي مربوط ومناسب اطلاعات كشف و براي استحراج نشان ن دار مي شوند: : قطعات استخراج شده مي توانند به شکل هاي ذیل باشند: موضوع ۰ هویت هاي با نام از قبیل اسامي شرکت ۰ مکان یا شخص . رابطه هاي ساده از قبیل قیمتها . مقاصد. کارکردها و یا ربطه هاي پیچیده ازقبیل شرح دادن ا شرمکس وا با مسا یقات | فو تال"

صفحه 31:
* قطعات استخراج شده اطلاعات از چندین منبع در یک پایگاه داده اي ترکیب مي شوند. ممکن است مناسباتي که از قبل تشخیص داده نشده اند , کشف شوند.

صفحه 32:
پرسشهاي زب بان طبيعي براي دسترسي به اطلاعات در پایگاه داده اي مورد استفاده قرار مي ود پایگاه داده اي ممکن ‎eles coal‏ داد های تسا خعار ی شده با محرن ی از عون دیجیتال باشد که در تن بخش هاي معین به عنوان پاسخ هاي بالقوه نشان دار شده اند.

صفحه 33:
ت ‎Ooo‏ زبان طبيعي ایجاد مي شود که محتواي اساسي پایگاه داده اي یا تغییرات آن را شرح مي دهد. گزارش مي تواند حاوي اعداد جمع شده . حداکش حداقل و بنيادي ترین تغییرات باشد.

صفحه 34:
؟تكنولوژي هايي که متون را ترجمه مي کنند يا به مترجمان کمک مي کنند . ترجمه خودکا ریا ترجمه ماشيني خوانده مي شود . حافظه ‎cle‏ ترجمه از مقادیر بزرگي متن همراه با ترجمه هاي موجود براي دنبال کردن موثر ترجمه هاي احتمالی کلمات » عبارات و جملات استفاده می کنند.

صفحه 35:
Output summary signal in language 2 answer to query relevant documents computer instructions Input “document(s)” (CNN broadcasts) signal in language 1 query query command in natural language Task summarization machine translation question answering — information retrieval user interfaces

صفحه 36:
طبقه بندي زبانهاي جهان ببان‌های آریانی (هندواروبایی 1800-570۳68۳ [نواد سپید] Ganskrit ) Avesticy 2 SL / aly! بهلوی ‎FEED‏ بارسى» لماک ‎wel‏ رن ‎es sa} tthe] cael‏ ی ‎hake) Tek 4‏ اردو ‎As]‏ ‎possi‏ آکجراتی ‎Je,‏ ‎esl‏ ‏لری ‎a FAIA]‏ sil

صفحه 37:
زبانهای سامی (50106110) |نواد خاکستری)؛ امى شمالى سامی جنوبی اکدی ‎el‏ ‏|سریانی ‎ee] PL esa‏ هه هم ها +

صفحه 38:
4 اسکاندیناوی silat >| یژیرن‎

صفحه 39:
|کره‌ای ey بندی زبانهاي جهان ازبان‌های چینی -تبتی ‎sip} (Sino-Tibetan)‏ 235{ آسیای شرقی اورال-آلتایی ‎SI ah}‏ |قرغیزی ‎ene]‏ قزاقى ‏ ارینوزی

صفحه 40:
امین مارامائي دنت نشجوی رشته ۳۳

51,000 تومان