صفحه 1:
In the name of God
Morphological
Analysis
Mohammad Bahrani
Feb 2011
صفحه 2:
مورفولوژي
۲ تعریف: چگونه کلمات از واحدهاي کوچکتر به نام تکواژ (morphemes)
تشکیل مي شوند.
۲ تکراژ (۳۱۵۲0۳6۳06): کوچکترین واحد دربردارنده معنا در زبان
دو دستة عمدة تكواقها:
* ريشه ها (5661۳5): تکواژ اصلي کلمه که دربردارندة معناي اصلي کلمه است.
وندها (3۴۴[65): تکواژهايي که معناهاي ديگري به ريشه اضافه مي کنند.
«(prefixes) baisdy «(Suffixex) bapy ba, O میانوندها
(infixes)
صفحه 3:
مورفولوژي
5 Concatenative morphology
* وندها به ریشه متصل مي شوند
5 Non-Concatenative morphology
* وندها به نحو پیچیده تري با ريشه ترکیب مي شوند
= Templatic morphology
صفحه 4:
چرا مورفولوژي؟
ليست كردن تمام شکل هاي مختلف لغات در مجموعه واژگان از
لحاظ محاسباتي غیربهینه است.
تا در زبان هايي که مورفولوژي پیچیده دارند. لییست كردن تمام اشکال
مختلف يك کلمه در عمل غیرممکن است.
* مثال از فارسي:
۲7 انقلابي ترينهایشانند: انقلابي + ترین + ها + شان +آند
5 * برادرمند
7 در فارسي يك اسم مانند "کتاب" داراي 100) صورت مختلف صرفي لست.
# مثال از تركي:
uygarlagtiramadiklarimizdanmigsinizcasina ©
صفحه 5:
چرا مورفولوژي؟
"۲ تجزیه يك کلمه به تكواژهاي تشکیل دهندة آن
(morphological parsing)
0 توليد صورت هاي مختلف (صرفي و اشتقاقي) يك کلمه با داشتن
ريشة آن
صفحه 6:
انواع مورفولوژي
تا مورفولوژي تصريفي (inflectional)
ترکیب ريشة کلمه با وندها به طوري که مقولة نحوي و معناي كلي کلمه
مورفولوزي اشتقاقي (06۲[۷110۳00۱)
CaS ريشه كلمه با وندها به طوري كه معناي جديدي توليد شود و احتمالاً
مقولة نحوي كلمه تغيير كند.
صفحه 7:
مورفولوژي تصريفي
۲7 در زبان انگليسي به طور عمده شامل:
* اتصال پسوند 5 (براي جمع) و "5 (براي مالکیت) به انتهاي اسم
اتصال پسوندهاي و10 :60 و 5 به انتهاي فعل
Regular Noun + s — Plural Noun =
book + 5 > books ®
Pox +3 > Powe ™
™ Regular Verb stem + ed > past verb
© dk + ed لامرن جح
® bey + ed > beyced
صفحه 8:
مورفولوژي تصريفي
5 در زبان فارسي شامل:
* اتصال پسوندهاي جمع, نکره, اضافه, ضمایر متصل و واژه بست هاي
ريطي به انتهاي اسم, صفت, ضمیر و عدد.
* شکل هاي مختلف تصریف فعل با زمان ها و شخص هاي مختلف
* اتصال تکواژ جمع (ان):
7 مرد + ان : مردان
7 گدا + ان : گدایان
7 فرشته + ان : فرشتگان
* اتصال تکواژ نکره ساز (اي):
۲ مرد + اي : مردي
5 گدا + اي : گدايي
7 فرشته + اي : فرشته اي
صفحه 9:
مورفولوژي تصريفي در فارسي: کلمات غیرفعل
م (evel) عم خانه ام
ت (ات, یت) چشمتخانه ات
Noun ش (اش, یش) شمش خانه
اش
مان (یمان) چشممان خانه
مان
تان (یتان)
چشمتان خانه تان
شان (يشان)
جشمشان خانه
شان
صفحه 10:
مورفولوژي تصريفي در فارسي: کلمات غیرفعل
م (ام, یم) مشغولمخسته ام
ي (اي, بي) مشغوليخسته اي
Noun
Adj + ست (است) مشغولست خسته
Pron است
(ou veal) as 97 5
مشغولیم خسته
ید (اید, (ay, ايم
مشغولید خسته اید
ند (اند, يند)
مشغولند خسته اند
صفحه 11:
مورفولوژي تصريفي: افعال
۵ <
* ۱06۳۱۲۷۵۱ رفتن:
PresentParticiple : رونده
PastParticiple : ais,
Present : p55 مي
Preterite : pis,
Imperfect : مي رفتم
Perfect : el ais,
Pluperfect : p25 ais,
Compound Imperfect : el ais, مي
DoubleCompound : pl o25~ ais,
Future m3, abrly>
صفحه 12:
مورفولوژي تصريفي در فارسي: افعال
۵ 5۵0 ۲
= Present : ps4
= CompoundPast : awl, ais,
5 Imperative
™ Present : 9.4
صفحه 13:
مورفولوژي اشتقافي
0 در فارسي و انگليسي: اتصال پسوندها و پيشوندهاي مختلف به اسم
صفت و ad
نی > compute + ation 5
Dlg + beheve + ube > ucbehevabl
كار + كر -> كاركر
دانش + مند -> دانشمند
صفحه 14:
Morphological Parsing
ل تجزيه يك كلمه به تكوازهاي تشكيل دهندة آن
لا براي تجزيه مورفولوزيكي حداقل به سه جزء زير نيازمنديم:
® 6([60۳0]: مجموعه لیاز ریشه هیک لماتو وندها بسه همرلم لطلاعاتي
در مورد آنها
"" ۳/0۲۵۳01۵1165: مجموعه لهاز قولنینمورفولوژيک ه نوع وندهاي
قابلاتصا ليه هر ريشه و ترتیبلتصالآنها را بیانميکسند.
* ۲۵۸۱65 0۲۲09۲30۱1: مجموعه لیاز قولنینلماييکه نوع
تسغییر در لملایکلمه را هنگام لتصانلوندها بسيانميکسند.
صفحه 15:
Finite State Automata
OQ: a finite set of N states: qo, Gy...) Ana
OY: a finite input alphabet of symbols.
O q,,the start state.
OF: the set of final states.
5 6(q,i) : the transition function
= 6(q,i)=q"
صفحه 16:
Finite State Transducers
OQ: a finite set of N states: qo, Gy...) Ana
OY: a finite alphabet of complex
(input:output) symbols.
= |: a finite alphabet of input symbols.
" O: a finite alphabet of output symbols.
O q,,the start state.
OF: the set of final states.
5 6(q,i:0) : the transition function
صفحه 17:
مثالی ان ۲ ۳۲5
صفحه 18:
منابع مورفولوژي فارسي
5 Karine Megerdoomian, “Persian Computational Morphology:
A Unification-based Approach", NMSU, CRL, Memoranda in
Computer and Cognitive Science, MCCS-00-320, 2000.
© Karine Megerdoomian, "Finite-state morphological analysis
of Persian”, In Proceedings of the Workshop on
Computational Approaches to Arabic Script-based
Languages, Coling 2004, University of Geneva, 2004.
"ا محرم اسلامي و همکاران. "واژگان زاياي زبان فارسي" مجموعه مقالات اولین
iis يوطي زبان فارسي و رایانه؛ تهران 009
5 بهرنگ قاسمي زاده و همکاران؛ ”روشي نوين جهت صرف وازه هاي فارسي":
يازدهمين كنفرانس بين المللي انجمن كامبيوتر ايران» COOP «oho