ترجمه ماشینی
اسلاید 1: Machine Translation ترجمه ماشینیارائه دهنده:احمد استيريزير نظر : دكتر کاهانیدانشگاه فردوسي مشهدپاییز 89
اسلاید 2: مطالبمقدمهپردازش زبانهای طبیعیترجمه ماشینیانگيزه ترجمه ماشينیتاريخچه ترجمه ماشينیمشکلات در ترجمه ماشينی اجزای اصلی معماری ماشین های ترجمهبیان کلی روش های ترجمه ماشینی و مقایسه آن هاارزیابی ترجمه ماشینیکارهای انجام شده در زمینه زبان فارسیجمع بندی و نتیجه گیری2
اسلاید 3: مقدمهپردازش زبانهای طبیعی نقشی بسیار عمده و کلیدی به خصوص در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر ایفا می کند.ترجمه ی ماشینی(Machine Translation) زیر شاخه ای از زبانشناسی محاسباتی میباشد که عبارت است از ترجمه ی متنی از یک زبان طبیعی به زبانی دیگر، توسط کامپیوتر. 3
اسلاید 4: پردازش زبانهای طبیعی نیاز اساسی به پردازش زبانهای طبیعی با توجه به رشد حجم مستندات تولید شده و نیاز به نگهداری، دسته بندی، بازیابی و پردازش ماشینی و سریع آنها موانع اساسینیاز به درک معانیحسن سیب را نخورد برای این که کال بود. حسن سیب را نخورد برای این که سیر بود.دقیق نبودن دستور زبانهاباز روی زمین نشست.4
اسلاید 5: زبانشناسی محاسباتی فرایافت concept و تجزیه زبان های برنامه نویسی:نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامه نویسی را به اثبات برساند.ترجمه ماشینی: شناخت مفهوم خاص یک واژه در جمله با تجزیه واژهها، نحو، مفهوم و سپس معناپرسش و پاسخ با زبانهای طبیعی:مسئله ارتباط انسان و ماشین صرف محاسباتی:به مطالعات مربوط به ساختارهای درونی کلمات صرف گفته میشود. 5
اسلاید 6: ترجمه ماشینی ترجمه ماشینی ترجمهای است که توسط کامپیوتر و بدون دخالت فرد انجام میشود. در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیکهای زبانشناسی پیکره ای، ترجمههای پیچیده بیشتری قابل دستیابی هستند.واكافت واژه اي، واكافت ساختواژي، واكافت نحوي و واكافت معنايي متن برای دستیابی به ترجمه ماشینی6
اسلاید 7: انگيزه ترجمه ماشينی جهانی سازی (Globalization)توسعه ارتباطات از طريق اينترنت رشد جالب توجه شبکههای اجتماعی، همانند فیس بوک یا پیامرسانهای فوری فراهم سازی وسیله ای مثل موبایل برای ترجمه همزمان در حین مکالمه دو شخص با دو زبان متفاوت و به صرفه بودن از ديدگاه اقتصادی گسترش متون علمی، فرهنگی، اخبار و ...7
اسلاید 8: تاريخچه ترجمه ماشينی ترجمه ی ماشینی از جمله ی اولین اهداف مورد نظر در علوم رایانه و بخصوص در حوزه ی هوش ماشینی به حساب میآید و سابقه ی آن به بیش از نیم قرن پیش از این باز میگردد. تلاش براي ساختن مترجم ماشيني از دهه سي ميلادي شروع شده بود. مترجم ماشيني را آن زمان وسيلهاي ساده نظير ماشين حساب ميدانستند كه به راحتي زباني را به زبان ديگر ترجمه ميكند. اين سادهانگاري اندك اندك جاي خود را به واقعبيني داد.نخستین ترجمهای که بطور کامل توسط کامپیوتر انجام شد، ترجمه ی متنی بود از زبان انگلیسی به زبان روسی. (1933 میلادی)در حال حاضر ایجاد یک ماشین ترجمه یکی از اصلی ترین سیاست های کشورها و شرکت های تجاری می باشد و علاقه مندان بسیاری نیز در این زمینه در حال بررسی و پژوهش می باشند.8
اسلاید 9: مشکلات ترجمه ماشینینیاز به درک معانیدقیق نبودن دستور زبانهازایایی پدیده زباننوع و پیچیدگی متون مورد نظرغلط های املایی، نحوی و نگارشی در متن9
اسلاید 10: اجزای اصلی معماری ماشین های ترجمهبخش واژگانیبخش صرفی بخش نحوی بخش معنايی10
اسلاید 11: روشهای ترجمه ماشینی شيوه مبتنی بر معماری مستقيم يا ترانسفورمر شيوه مبتنی بر انتقال شيوه ميان زبانیروش مبتنی بر پيکره زبانیروشهای آماری ترجمه ماشينیروشهای مبتنی بر مثال ترجمه ماشينیسيستم های زبان کنترل شدهسيستم تمام-خودکار ترجمه ماشينی (FAHQT)ترجمه ماشینی پیوندی (Hybrid)11
اسلاید 12: بررسی روشهای ترجمه ماشینیروشهای آماری ترجمه ماشينی:در روشهای آماری هدف، حداقل سازی خطای تصمیم، با استفاده از تئوری تصمیم آماری یا قاعده بیز میباشد. در واقع به مسئله ترجمه به صورت یک مسئله یادگیری ماشین برخورد می کند .شیوه کلی آنها در واقع بررسی دقیق ترجمه های انجام شده توسط انسان ، آموختن آن و سپس ارایه ترجمه بر اساس آموزش های مرحله قبل می باشد .روشهای مبتنی بر مثال ترجمه ماشينی یا روشهای مبتنی بر حافظه:استفاده از ترجمه های انسانی موجود یا پيکره های دوزبانه برای ترجمه متنهای جدید بهره گیری از واژگان معنایی (WordNet) بسیار عظیم و گسترده 12
اسلاید 13: بررسی روشهای ترجمه ماشینیسيستم های زبان کنترل شده:سيستمهایكاربردی با مجموعه واژگان و ساختارهای معين و از پيش تعيين شدهمتون نوشته شده کمتر دارای ابهام بوده و لذا ماشين ترجمه کمتر مشکل ابهام زدايی خواهد داشت.متن اوليه بهتر و در نتیجه متن خروجی با کيفيت بهترسيستم تمام-خودکار ترجمه ماشينی (FAHQT):تمام اتوماتیک کردن فرآیند ترجمه با توجه پيشرفتهای حاصله در سالهای اخير در زمينه هوش مصنوعی، سيستمهای فازی و شبكه های عصبیپيش- ويرايش و پس-ويرايش متنغلط ياب املايی و نحوی 13
اسلاید 14: بررسی روشهای ترجمه ماشینیترجمه ماشینی پیوندی (Hybrid)روش پیوندی، قدرتمندی دو روش آماری و قانونمند را باهم ادغام می کند.معیارهای آماری از ابتدا توسط قوانین هدایت میشوند. قوانین برای پیش-پردازش دادهها برای هدایت بهتر موتور آماری استفاده می شوند. قوانین همچنین برای پس-پردازش خروجی موتور آماری برای پیاده سازی عملیاتی همچون نرمال سازی و رفع ابهام از متن موجود استفاده می شوند.14
اسلاید 15: مقایسه روشهای ترجمه ماشینیدشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص می باشد. هر کدام از این روشها دارای نقاط قوت و ضعف اساسی می باشند:به عنوان مثال یک پیکره وسیع چند زبانی از داده ها، برای روشهای آماری مورد نیاز میباشد که عمل استنتاج با توجه به آنها صورت می گیرد. حال آنکه برای روشهای مبتنی بر دستور زبان لازم نیست.اما از سویی دیگر روشهای مبتنی بر دستور زبان نیاز به یک زبان شناس حرفه ای برای طراحی دقیق دستور زبانی که استفاده خواهد شد، دارند و در این روشها پیچیدگی نسبتاً زیادی موجود است.15
اسلاید 16: ارزیابی ترجمه ی ماشینیقدیمیترین روش استفاده از داورهای انسانی برای ارزیابی کیفیت یک ترجمه میباشد.ابزارهای ارزیابی خودکار شامل بلو محصول شرکت آیبیام(BLEU)، نیست(NIST) و متئور (METEOR) می باشند.جایگزین ارزشیابی دوزبانه یا BLEU : عددی بین صفر تا یک تست ماشین ترجمه با متون پیچیده، طولانی و یا حاوی لغات چند معنا تست ماشین ترجمه با ترجمه برعکس متون16
اسلاید 17: کارهای فعلی ترجمه ماشینی در زبان فارسی پروژه دنا 1 و دنا 2 توسط دانشگاه صنعتی شریفترجمه ماشینی با بهره گیری از روشهای آماری توسط تیم تحقیقاتی دکتر عبدالحسن صراف زاده (رئيس دانشكده كامپيوتر و فناوري اطلاعات دانشگاه يونيتك نيوزيلند) استفاده از پیکره های بسیار عظیم تک زبانه و دو زبانه برای بهبود روند ترجمهترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکرههای متنی دوزبانی استفاده می کنند.یادگیری (Learning) یکی از پایه های اساسی این روش بشمار می رود.نتیجه بهتر در ترجمه انگلیسی به فارسی نسبت به Google Translate به خاطر وجود Persian monolingual corpuse عظیمتر و گسترده تر17
اسلاید 18: آینده ترجمه ماشینی ترجمة نوشته به صوت برگردان نوشته به نمایش گرافیکی زبان اشاره ترجمه صوت به صوت ترجمه صوت به متن چه در داخل یک سیستم زبانی و چه به زبان دیگر18
اسلاید 19: جمع بندی و نتیجه گیری ترجمه ماشینی، به معنای ترجمه خودکار جملات از یک زبان طبیعی به زبان دیگر است، به گونه ای که فرد بومی زبان مقصد، همان مفهومی را دریافت کند که گوینده مدنظر داشته است.گام های مورد نیاز در ترجمه ماشيني عبارت اند از: واكافت واژه اي، واكافت ساختواژي، واكافت نحوي، واكافت معنايي، تشخيص نقش كلمات در جمله، تشخيص معناي صحيح كلماتمهمترين بخش يك مترجم كه دقت در آن باعث بالا رفتن دقت كل عمل ترجمه مي گردد، رفع ابهام معنايي از كلمات جملات زبان مبدا ونيز رفع ابهام از ترجمه آنها به زبان مقصد مي باشد. 19
اسلاید 20: جمع بندی و نتیجه گیری سیستم های مترجم فعلی عموما مبتنی بر قواعد زبانی ، مبتنی بر نوشتجات نمونه و ترجمه ماشینی مبتنی بر روشهای آماری، می باشند.در حال حاضر، بهترین عملکرد مربوط به سیستم های ترجمه ماشینی مبتنی بر روشهای آماری می باشد.با این وجود، یکی از چالشهایی که همچنان ترجمه ماشینی مبتنی بر روشهای آماری و همه روشهای مرسوم، با آن دست به گریبانند، موضوع عدم توجه به معنا و مفاهیم درون متن می باشد. 20
اسلاید 21: پیشنهادات تهیه واژگان معنایی (WordNet) بسیار عظیم و گسترش و بروزرسانی متداوم آنمحدود کردن حوزه ی موضوعی متن یا تهیه واژگان معنایی به ازای موضوعات متفاوت وابسته با متون مختلفبهره گیری از ساختارهای پیش پردازش و پس پردازش برای استانداردسازی متن در نظر گرفتن کلیه غلط های املایی، نگارشی و ... در ابزار پیش پردازش متن21
اسلاید 22: منابع[1] Booth, K. H. V. (1967). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. 53-76). Amsterdam: North-Holland Publishing Company. [2] Crystal D.، The Cambridge Encyclopedia of Language، 2nd edition، Cambridge University Press، 1996. ISBN 0-521-55967-7[3] فرحزاد ف. استاد زبانشناسی و مطالعات ترجمة دانشگاه علامه طباطبایی، روزنامه کیهان [4] Manning، C. D.، and Schutze، H.، Foundations of Statistical Natural Language Processing، 5th edition، The MIT Press، 2002. ISBN 0-262-13360-1 [5] Boretz, Adam, AppTek Launches Hybrid Machine Translation Software SpeechTechMag.com (posted 2 MAR 2009)[6] Claude Piron, Le défi des langues (The Language Challenge), Paris, LHarmattan, 1994.[7] امامی م . بررسی مسایل درك متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه كارشناسی ارشد، دانشكده مهندسی كامپیوتر، دانشگاه صنعتی شریف.،1376. [8] صراف زاده ع. سمینار علمی ، آمفي تئاتر دانشكده مهندسي، 1389 . [9] Milestones in machine translation - No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins22
اسلاید 23: با سپاس از توجه شما23http://Ahmad.Estiri.fumblog.um.ac.ir
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.