سیستم هوشمند تشخیص وزن عروضی اشعار فارسی
اسلاید 1: سیستم هوشمند تشخیص وزن عروضی اشعار فارسیمحمد مهدی مجیریاستاد راهنما: دکتر بهروز مینایی« شهریور 1387 »1
اسلاید 2: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری2
اسلاید 3: 1-مقدمه1-1- وزن عروضی؟1-2- دلایل تحقیق بر روی عروض1-3- این سیستم چه کاری نمیتواند انجام دهد؟1-4- این سیستم چه کاری میتواند انجام دهد؟3
اسلاید 4: 1-1- وزن عروضی؟قافیه و مغلطه را گو همه سیلاب ببرمفتعلن مفتعلن مفتعلن کشت مرا(مولانا)مفتعلن مفتعلن مفتعلن مفتعلنتنتَتَتَن تنتَتَتَن تنتَتَتَن تنتَتَتَنمرده بدم زنده شدم گریه بدم خنده شدم دولت عشق آمد و من دولت پاینده شدم (مولانا)4
اسلاید 5: 1-2- دلایل تحقیق بر روی عروضمطالعات مربوط به واج شناسیمطالعات مربوط به سبک شناسیتحقیق بر روی خلقیات شاعرتحقیق بر روی خلقیات زمانهسختی تشخیص وزن عروضیسرعت پایین یافتن وزن عروضی5
اسلاید 6: 1-4- این سیستم چه کاری میتواند انجام دهد؟وزن بیت ورودی را تشخیص میدهدفقط 31 وزن معروف و پرکاربرد وجود بیش از 300 وزن فارسی بیش از 90 درصد اشعار از این 31 وزن (شمیسا) نزدیک 99 درصد اشعار از 29 وزن (کامیار)6
اسلاید 7: 1-3- این سیستم چه کاری نمیتواند انجام دهد؟عدم تشخیص وزن، غیر از 31 وزن پرکاربردعدم توانایی درستی یا نادرستی و یا شکستگی اوزانعدم تشخیص وزن رباعیعدم تشخیص وزن شعر نو7
اسلاید 8: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری8
اسلاید 9: 2- آشنایی با عروض9مبتنی بر توالی خاصی از هجای کوتاه و بلنددرست خواندنتولید رشته صامت-مصوتتقطیع رکن بندیوزن عروضیاختیارات شاعری
اسلاید 10: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری10
اسلاید 11: 3- ساخت مجموعه دادهعدم وجود Data Setساخت مجموعه داده با استفاده از اشعار حافظ و مولاناآماده سازی بیش از 1000 بیت11
اسلاید 12: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری12
اسلاید 13: 4- الگوریتم پیشنهادی4-1- حرکتگذاری4-2- تبدیل مصراع حرکتگذاری شده به رشته CV4-3- اصلاح رشته CV بر اساس اختیارات شاعری4-4- تبدیل رشته CVاطلاح شده به رشته Udash4-5- اصلاح رشته Udash بر اساس اختیارات شاعری4-6- انطباق رشته Udash با یکی از اوزان پرکاربرد13
اسلاید 14: 4-1- حرکتگذاریبا استفاده از مجموعه لغات استفاده از مجموعه لغات برنامه متنباز «واژگان زایای زبان فارسی» 50000 لغتبدون استفاده از مجموعه لغات به تنهایی 30% جواب داده است14
اسلاید 15: 4-2- تبدیل مصراع حرکتگذاری شده به رشته CV15تلفظ حرفحرفنشانهنوعمثالتلفظ مثالAاvvمصوت بلندناسزاnAsezAiیvvمصوت بلندحصينhasinuاوvvمصوت بلندسوزsuza-َvمصوت کوتاهبهجتbahjate-ِvمصوت کوتاهزرنگzerango-ُvمصوت کوتاهمناظرهmonAzereءcصامتآيهAyeOtherبقیه حروفcصامتبهشتbeheSt
اسلاید 16: 4-3- اصلاح رشته CV بر اساس اختیارات شاعریشاعر مختار است در آخر مصراع یک یا دو حرف صامت، اضافه بر فرمول بیاورد(یا نیاورد).هرگاه بعد از نونی که بعد از مصوت بلند قرار گرفته است، سکون یا مکث باشد، از کمیت مصوت بلند کاسته میشود.16
اسلاید 17: 4-4- تبدیل رشته CVاطلاح شده به رشته Udash17صامت-مصوتصامت-مصوتنشانهنوع سیلابcvcUهجای کوتاه cvccvv–هجای بلند
اسلاید 18: 4-5- اصلاح رشته Udash بر اساس اختیارات شاعریهجای کوتاه در آخر مصراع بلند حساب میشود.شاعر مختار است به جای فعلاتن در رکن اول هر مصراع، فاعلاتن بیاورد.U--UU UU--UU”فاعلاتن فعلاتن فعلاتن فعلاتنU--UU UU—U-”فاعلاتن مفاعلنفعلاتن مفاعلن18
اسلاید 19: 4-6- انطباق رشته Udash با یکی از اوزان پرکاربرد19کدرشته Udashوزننام1001UU--UU--UU--UU-فعلاتن فعلاتن فعلاتن فعلنرمل مثمن مخبون محذوف1002U-U-UU--U-U-UU-مفاعلن فعلاتن مفاعلن فعلنمجتث مثمن محذوف1003--U-U-UU--U-U-مفعول فاعلات مفاعيل فاعلنمضارع مثمن اخرب مکفوف محذوف1004-U---U---U---U-فاعلاتن فاعلاتن فاعلاتن فاعلنرمل مثمن محذوف1005U---U---U---U—Uمفاعيلن مفاعيلن مفاعيلن مفاعيلهزج مثمن سالم1006U---U---U--مفاعيلن مفاعيلن فعولنهزج مسدس محذوف1007--U-U----U-U--مفعول فاعلاتن مفعول فاعلاتنمضارع مثمن اخرب1008--UU--UU--UU--مفعول مفاعيل مفاعيل فعولنهزج مثمن اخرب مکفوف محذوف1009UU--U-U-UU-فعلاتن مفاعلن فعلنخفيف مخبون محذوف1010-U---U---U-فاعلاتن فاعلاتن فاعلنرمل مسدس محذوف
اسلاید 20: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری20
اسلاید 21: 5- انطباق5-1- الگوریتمهای انطباق رشته5-2- الگوریتمهای ابداعی5-3- ترکیب الگوریتمهای انطباق رشته21
اسلاید 22: 5-1- الگوریتمهای انطباق رشتهمقایسه رشته ورودی با مجموعهای از رشتههابرگرداندن مقدار برازندگیRabin-Karp – Bitmap - SoundexLevenshtein Distance کمترین تغییر مورد نیاز برای تبدیل یک رشته به رشته دیگرRhythmRytgm22
اسلاید 23: 5-2- الگوریتمهای ابداعیالگوریتم XOR23(0/625 = 16 / 10)
اسلاید 24: 5-2- الگوریتمهای ابداعی (ادامه)24الگوریتم XOR برای اعمال اختیار شاعری قلب(0/75 = 16 / 12)
اسلاید 25: 5-2- الگوریتمهای ابداعی (ادامه)الگوریتم XOR برای اعمال اختیار شاعری تسکین25(0/68 = 16 / 11)
اسلاید 26: 5-3- ترکیب الگوریتمهای انطباق رشته26
اسلاید 27: 5-3- ترکیب الگوریتمهای انطباق رشته (ادامه)27
اسلاید 28: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری28
اسلاید 29: 6- آزمون6-1- آزمون کلی6-2- آزمون به تفکیک وزن6-3- دلیل ضعف تشخیص در برخی اوزان6-4- ترکیب اوزان نزدیک به هم29
اسلاید 30: 6-1- آزمون کلی 1297 بیت شعر ورودی تشخیص صحیح وزن 851 بیتصحت 65.61درصد 30
اسلاید 31: 6-2- آزمون به تفکیک وزن31
اسلاید 32: 6-3- دلیل ضعف تشخیص در برخی اوزاننزدیکی اوزان به یگدیگر-U---U---U---U-1004-U---U---U---U--103032
اسلاید 33: 6-4- ترکیب اوزان نزدیک به هم33کد وزن 1کد وزن 2درصد شباهتتفاوت1001102593.75یک «-» اضافه در آخر1002101493.75یک «-» اضافه در آخر1004103093.75یک «-» اضافه در آخر1015102290.91یک «-» اضافه در آخر1022102392.28یک «-» اضافه در آخرترکیب 8 وزن = نزدیک به 70 درصد پاسخ صحیح
اسلاید 34: سرفصلمقدمهآشنایی با عروضساخت مجموعه دادهالگوریتم پیشنهادیانطباقآزموننتیجهگیری34
اسلاید 35: 35
اسلاید 36: 36
اسلاید 37: پیشنهادات1- استفاده از الگوریتم ژنتیک برای به دست آوردن وزن توابع شباهت2- استفاده و آزمایش دیگر توابع انطباق رشته3- استفاده از ساختار سلسله مراتبی برای به دست آوردن وزنها4- استفاده از ساختاری دیگر مانند شبکه عصبی برای یافتن شباهت5- افزودن تمامی 300 وزن فارسی37
اسلاید 38: نتایج پژوهشی“سیستم هوشمند تشخیص وزن عروضی اشعار فارسی: کاربرد جدیدی از متن کاوی“، محمد مهدی مجیری، بهروز مینایی، کنفرانس ملی دادهکاوی ایران، 138738
اسلاید 39: }پرسش و پاسخ{39
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.