صفحه 1:
۱۷/۷۷
| اتوما ای پا دگیر ,
Learning Automata
©
توید يذزكار - مضظفى تعمتى - ار .له
صفحه 2:
فر[یند یادگیری
فرایندی که طی آن موجودات زنده مطللب مختلف را یاد می گیرند موضوع مورد
علاقه بسیاری از دانشمندان بوده است.
و
8 تحقیقاتی که در این زمینه صورت گرفته است در دو شاخه کلی متمرکز است:
۱-درک فرایندی که موجودات زنده در طی آن اقدام به یادگیری می کنند.
۲- بدست آوردن روش هایی که با استفاده از آنها بتوان این قابلیت را به ماشین منتقل
نمود.
صفحه 3:
فر[یند یادگیری
تعریف پادگیری:
اعمال یک سری تفیبرات در کارایی سیستم براساس تجارب قبلی است.
۲ میاه دون ۲
مهمترین مشخصه یک سیستم یاد گیر:
افزايش کارایی آن با گذشت زمان.
.. ۵
صفحه 4:
فر[یند یادگیری
تخریف ریاضیی ریک سيستتم ,یا گید
Gas یک سیستم یادگیر بهینه سازی یک عملکرد است که کاملا امکان
ناسایی آن وجود ندارد.
3
00
بر طبق اين تعريف:
مى توان هدف سيستم يادكير رابه يك مساله بهينه سازى كه بر روى
یک مجموعه پارامتر تعریف شده است کاهش داد و با بدست آوردن
پارمترهای بهینه از طریق روش های موجود آن را حل کرد.
صفحه 5:
تارینیه (توماتای یادگیر
۲ ۷۷ یاج دنا
مفهوم اتوماتای تصادفی ab ods! Stochastic Automata)
توسط تستلین (165111۲0) در سال ۱۹۶۰ در اتحاد جماهیر شوروی ارائه
شد.
۷
يس از آن در تحقیقات بعدی نمونه های مختلفی از کاربردهای روش های
یادگیری در سیستم های مهندسی بوجود أمد كه از لن جمله مى توان به
سیریاب تلفن. شناسایی الگو و تقسیم بندی اشیاء و کنترل قلبل تطبیة
اشاره کرد.
۵٩ از © hs
صفحه 6:
تارینیه (توماتای یادکیر
7 در دهه ۶۰ میلادی سایپکین (5[01610) روشی برای ساده کردن مسائل
فوق برای تشخیص پارامترهای بهینه و بکاربردن روش های تپه نوردی
برای حل آن» معرفی کرد.
‘ تستلین و همکارائش در همان زمان کار. بر روی اتوماتاهای یادگیر را آغاز
oll gay 5" بياد كير يراق أولين بار توس ی عظرح شد,
7 تستلین به مدلسازی رفتارهای سیسیتمهای بیولوژیکی علاقمند بود و یک
اتوماتای قطعی که در محیط تصادفی فعالیت می کرد را به عنوان مدلی
برای یادگیر معرفی کرد.
۵٩ از ©
صفحه 7:
تاریفیه (توماتای یادگیر
رویکرد دیگری که توسط نارندرا (13۲6001۳3) و همکارش به کار
0
3 گرفته شد. در نظر گرفتن مساله به صورت بيدا كردن اقدام بهينه از ميان
3
مجموعه اقدام هاى مجاز اتوماتاى تصادفى بود.
۵٩ از 0
صفحه 8:
[توماتای یادکیر
7 یک اتوماتای یادگیر را میتوان بصورت یک شی مجرد (۸۵۵5۲۲۵6
006) که دارای تعداد متناهی عمل است. در نظر گرفت.
wor uz
اتوماتای یادگیر با انتخاب یک عمل از مجموعه عمل های خود و اعمال آن
بر محیطء عمل میکند.
7 عمل مذکور توسط یک محیط تصادفی ارزیلبی میشود و اتوملتا از پاسخ
محیط برای انتخاب عمل بعدی خود استفاده میکند.
* در طى اين فرايند اتوماتا ياد میگیرد که عمل بهینه را انتخاب نماید.
۵٩ از ©
صفحه 9:
(توماتای یادگیر
۱ 7 نحوه استفاده از پاسخ محیط به عمل انتخابی اتوماتا که در جهت انتخاب
۲ عمل بعدی اتوماتا استفاده میشود. توسط الگوریتم یادگیری اتوماتا
مشخص میگردد.
میاه جون۲۵
قسمت های اصلی اتوماتای یادگیر:
۱-یک اتوماتای تصادفی با تعداد محدودی عمل و یک محیط تصادفی
که اتوماتا با آن در ارتباط است.
۲-لگوریتم یادگیری که اتوماتا با استفاده از آن عمل بهينه را ياد
صفحه 10:
(توماتای یادگیر
< یک اتوماتا بصورت پنجتایی ۵۳,۵ )542 تعریف میشود که :
9 في جه 7/ * © > 2 تابع تولید وضعیت جدید.
۵٩ از ©
صفحه 11:
(توماتای یادگیر
2 ين ج+- © > © تابع خروجی که وضعیت فعلی را به خروجی بعدی
3 نگاشت میکند.
4,9 ...يك ,#) <(860 مجموعه وضعیتهای داخلی اتوماتا در لحظه 0.
میباشند.
۵٩ از ©
صفحه 12:
[توماتای یادکیر
g
8
تجموعه خروجى هاى اتوماتا مجموعه ورودی های اتوماتا
p= (BBs: Be}
صفحه 13:
(توماتای یادکیر
7 تولبع ۳ و 3) وضعیت فعلی ورودی رابه خروجی بعدی (عمل بعدی) اتوماتا نگاشت
4
بر حسب نگاشت های ۳ و 3) می توان تقسیم بندی زیر را انجام داد:
wosayzqid man
- اگر نگاشتهای "و تاق باشند. اتوماتا یک اتوماتای ق
و 9۳ ishing!
out (Deterministic Automata) میشود.
یا طلاع از وضمیت فغلی اتوماتا و وروی انوماتا زیانخ عبط وضعیت بیدی اتومانا و
افنام آن مشخضص میباشد:
صفحه 14:
[توماتای یادگیر
۲- اگر نگاشتهای ۴ و 3) تصادفی باشند. اتوماتا یک اتوماتای تصادفی
(Stochastic نامیده میشود.
wioo"ayzou
با اطلاع از وضعیت فعلی اتوماتا و ورودی اتوماتا (پاسخ محیط)». فقط احتمال
وضعیت بعدی اتوماتا و اقدام آن مشخص میباشد.
© نس
صفحه 15:
تقسيم بندى اتوماتاها
«Fixed Structure Automata) cot اتوماتا ى با ساختار 7
در اتوماتاى يادكير با ساختار ثابت احتمال عملهاى اتوماتا ثابت هستند.
لمر مياه" دوننا
«Variable Structure Automata) px» bls b cls! ~
در اتوماتای تصادفی با ساختار متفیر احتمالات عملهای اتوماتا در هر تکرار بروز
میشوند.
در اتوماتای یادگیر با ساختار متفیر تغییر احتمالهای عملها بر اساس الگوریتم
یادگیری انجام میشود.
صفحه 16:
در آتوماتلی یآذگیر با ساشتار متفیر وضعیت داقلی اتوماتا ۵ توسط
¢ احتمالات عملهاى اتوماتا بازنمايى مىشوند. وضعيت داخلی اتوماتا 90
+ در لحظه ۱ را با بردار احتمال عملهاى اتوماتا (۳) كه در زير آمده
است. نشان داده میشود:
P(r) = {p1(7), P20)... Pr} مور که
vn . p(n) =Probla(n) =a,] مک
a
7 در آغاز فعالیت اتوماتء احتمال عملهای ن با هم برابر و مساوی میباشند (که ۲
تعداد عملهای اتوماتا میباشد).
۵٩ از
صفحه 17:
ENVIROMENT متیط
یادگیری در رویکرد مبتنی بر اتوماتاهای یادگیر. بصورت تشخیص یک
اقدام /عمل بهینه از میان مجموعه اقدامهای مجاز میباشد.
۱
9 اين اقدام در یک محیط تصادفی اعمال میشود.
٩ محیط با تولید یک خروجی به اقدام اعمال شده پاسخ میدهد.
..
صفحه 18:
محيط
محیط را میتوان توسط سهتایی [6 0/۰/3۰ سدق _ نشان داد که :
بط ۵ < :0
ta, مجموعه ورودیهای محیط (خروجی های اتوماتا»
وه تبره :دونه “©
Bu سيق
+8 62 مجموعه خروجیهای محیط (ورودی های اتوماتا؛
{C,,09,..0,}'0 @ € مجموعه احتمال ماق تجزیمه النت:
صفحه 19:
۵و جویی
i
i
وه
3
۱
3
1
1
1
?
1
محیط
Pr(A(11) is unfavorable|a(n) = @,) =e,
cj = Prob{ gon) =1] a(n) = ay}, i= (1,2... 7}
صفحه 20:
مجموعه خروجی های محیط
مجموعه ورودی های محیط
a= .ب وه ريما a,}
صفحه 21:
Cw aby) (توماتای یادگیر و معبط
مع نميه :دوين
.. 2
صفحه 22:
مدل های مبیط
بر حسب :8 ها (پاسخ محیط) داریم:
چ مدل ۳:
اگرخروجی محیط تنها دو مقدار ۰ وا را اختیار کند .
. مدل 00 :
تعداد محدود (به طور گسسته)؛ در بازه 1ه ۰] باشد.
1 مقل 5:
چنانچه خروجی محیط یک متغیر تصادفی با مقادیر احتمال در [+N] oj
باشد.
mm)
صفحه 23:
مدل های مبیط
c, = Pr(B(n) is unfavorablele(n) =) Sab ها ثابت و مشخض qs
90
7 نیازی به یادگیری نیست!
3 اقدام بهینه - اقدامی با کمترین جریمه.
۷مسائلی که.» ها ناشناخته هستند مورد نظر میباشند.
.. ©
صفحه 24:
معیارهای رفتار (توماتای پادگیر
ly” | اندازه كيرى كارليى اتوماتاى يادكير تصادقى شاخصهاى معينى تعريف
روشهای مختلف یادگیری را فراهم می آورند .
3
BS
Cc
gs
3
3
3
۷
a (Pure-Chance Automaton) (az. (ila یک اتوماتاى
صورت اتوماتایی تعریف می شود که عمل های آن هميشه احتمال یکسانی
برای انتخاب شدن داشته باشند.
بنابرلین یک اتوماتای یادگیر بلید از یک اتوماتای تصادفی محض بهتر عمل
کند.
۵٩ از © :
صفحه 25:
معیارهای رفتار [توماتای یادگیر
۲
داده می شود که ,6 احتمال جریمه متناظر با عمل :2 است.
الم2باه"دوننا
*مقدار (1/1)0 به صورت ميانكين جريمه هاى دريافت شده توسط اتوماتا
(براى یک بردار عمل مفروض) تعريف و بر اساس رابطه زيرمحاسبه مى
مود [(2)ص /1- 69 ]ءظ - [(نيم M(n) = E[A(n)!
© )بصت رح - [به > (۳:]6[به > Pel B(m) =1/ a(n) =
2 5
از ۵٩
صفحه 26:
معیارهای رفتار (توماتای پادگیر
ا "برای یک اتوماتای تصادفی محض میانگین جریمه ها (1/)1 يك عدد
ثابت والاا است که طبق رابطه زيربه دست مى آيد.
لم 1
#بنابراین اتوماتایی که بخواهد بهتر از اتوماتای تصادفی محض foe كند بايد
| میانگین جریمه های کمتری از 1۷/0 داشته باشد.
|
از آنجلیی که (۷)۲ یک متغیر تصادفی است امید ریاضی سل
و/۷] مقایسه می شود. بنابراین اسلاید های بعد را خواهیم داشت.
۵٩ از ©
صفحه 27:
معیارهای رفتار [توماتای یادگیر
اتوماتای یادگیر مصلحت اندیش]6۳ 66060 :
worayzoid mma”
lim E[M(n)]<M , “sl
ey 5 روت اه ارات C8 Leal ee} eal”
اين نوع اتوماتون صرف بهتر از اتوماتون مبتنی بر شانس عمل میکند و
رفتار بهینه ندارد.
.. 2
صفحه 28:
معیارهای رفتار [توماتای یادگیر
7 اتوماتای یادگیر بهینه 0011۳۳۵۱ :
FI + (,6) 2190 ه lim E/M(n)/ =c,
عجر
١
در حالى كه بهينه بودن اتوماتا يك ويزكى مطلوب در محيطى ايستا به
شمار مى رود»ء در عمل ممكن است يك كارائى زيربهينه مورد نياز باشد.
يك محيط واقعى معمولا متغير است و در صورتى كه توزيع متغير در طول زمان تغيير
کند.از اتضلیی که الگفریتم بر روت old elle ges متوقف تقى ملند یک اتومادای تیته
مخ تر می باشد.
از ۵٩
صفحه 29:
معیارهای رفتار [توماتای یادگیر
اتوماتای یادگیر بهینه 001[۳00۱-ع :
lim L[M(n)]<c,te ,Ve>0 ¢, = min{e,}
wor Bava
"مناسب در یک محیط غیرایستا 00۳-511003۳۷ است.
., 2
صفحه 30:
معبارهای رفتار (توماتای یادگیر
7 اتوماتای یادگیر 606016( ۸۵050۱۱۲6۱۷ گفته میشود. اگر :
MG) > [چمد | را م2
Yn, YG) €(O), forall possiblesetsfey? = 12,...7)
wooayzord man
علت آنکه در سمت راست نامساوی از امید ریاضی استفاده ننمودهليم آنست که چون مرحله 0ام
را يشت سر گذاشتهايم. پس (۷۱)۲ ثلبت است ولی (1 +1)۲۱ احتمللی است و بستگی به
Jo p(n)
۵٩ از
صفحه 31:
معیارهای رفتار [توماتای یادگیر
Qo Gls © as Expediency 7 دهد که اتوماتای یادگیر بهتر از اتوماتای
+ تصادفی محض عمل می کند. بنابراین بهینگی شاخص مناسب تری برای
مقایسه روش cle مختلف یادگیری می باشد.
youd
2
3
«بهینة بودن اطمینان می دهد که.عملی که توسط ائومائا انتخاب می لوف
عملی بهینه باشد. در محیط های واقعی به علت متغیر بودن محیط رفتار زیر
بهینه ارجحیت دارد.
., ©
صفحه 32:
(لگوریتم یادگیری
2 الگوریتم یادگیری آ می تواند به صورت زیر نشان داده شود:
Pn tl) = Tem), a), 80D)
wooayzord man
7 اگر عملکرد خطی باشد الگوریتم یادگیر خطی و در غیر اين صورت
غیرخطی نامیده می شود.
., ©
صفحه 33:
(لگوریتم پادگیری
7ایده اصلی الگوریتم های یادگیر به صورت زیر است:
اگر اتوملتا در تکرار 10 ام عمل: 01 را انتخاب کند و از محیط پاسخ مطلوبی
دریافت کند. احتمال 0 :مربوط به عمل انتخاب شده افزلیش می یابد و
9
احتمال سایر اعمال کاهش می یابد.
۲اگر پاسخ دریافتی از محیط نامطلوب باشد احتمال():کاهش و سایر
احتمالات افزایش می یابد.
صفحه 34:
(لگوریتم یادگیری
man مرو جویی
.,
7 پاسخ مطلوب از محیط 8)0(<0 :
7 ز ,۷
7 پاسخ نامطلوب از محیط 8)۴(<1 :
Wi, jel
pla D=p.@)+ Y flv)
ja
jai
Pr = pj) filp)O]
HOrtl=,00-Yig L200)
pl
ye
pit) =pi)- g,Le 00]
صفحه 35:
(لگوریتم یادگیری
*تولبع ,] و :9 دو تلبع غير منفی هستند که منظور پاداش و جریمه بکار برده
g می شوند که به صورت زیر تعریف می شوند:
> () ,هه - (( fle,
تا
b
روط[ ردارو ( >
که
تعداد لقدلم هایتوماتا ۲ *
۵٩ از
صفحه 36:
(لگوریتم یادگیری
7اگر پارامتر 2 و 10 مساوی باشند. طرح ياداش- جريمه خطى يا مهأ
۲
9g (ge odgali (Learning Reward-Penalty)
wwoo'ayzard'mn
“در اين روش نرخ آيديت بردار احتمال در هر گام زملنی صرفنظر از پاسخ
مسج كسان eal)
., 2
صفحه 37:
(لگوریتم یادگیری
| < اگر پارامتر ۵ یادگیری بربر با صفر باشد. به اين روش پاداش خطی يا يهأ
(86۷/۵۲۳۵-۱۱۵600 ۱6۵۳09) می گویند.
wokeyzod mm
أين به لين معنى آست كه احتمالات عمل :درببرابر ياسخ جايره از.محيط آبديت مى
شود اما جريمه ها ازريابى نمى شوند.
“اكر 3 >> ( باشد. روش يادكيرى جريمه جزيى- ياداش خطى يا ممأ بدست مى
آید.
صفحه 38:
(لگوریتم یادگیری
با استفاده از معادلات ذکر شده داریم:
4
F
7
Pint) = pm) +۵]1- 2, )([
تعر 87 (6رصده-0- لاجمارم
wooayzordmam >:
“اب - ياسخ نامطلوب
()بص(ة -1) - (1 + ).مر
+ + )1- رمز We fei
8
صفحه 39:
انواع اتوماتاهاى يادكير
» اتوماتاهاى يادكير را بر اساس نوع بردار احتمال مى توان به دو دسته كلى
تقسیم کرد:
آتوماتاغانی با ساعتاز قات:
0818 اج دونه
بردار احتمال آن در طى اجراى الكوريتم ثابت است.
pty Steet gsty
بردار احتمالات در طول اجرای الگوریتم تغییر می کند.
., 2
صفحه 40:
(نواع [توماتاهای یادگیر با سانتار ثابت
” اتوماتاى يادكير با ساختار ثابت را با يك پنج تایی به شکلم(ق, 0 ,],0) ۸
نشان می دهندکه در آن 0 مجموعة عمل هاء 0 مجموعهٌ ورودی ها
۱
از محیط. ۳ تابع تغییر وضعیت براساس پاسخ محیط و 3) تابعی است
که وضعیت فعلی را به خروجی بعدی نگاشت می کند. Db مجموعه
حالات داخلی اتوماتاست.
۵٩ از ©
صفحه 41:
(نواع [توماتاهای یادگیر با سانتار ثابت
۱- اتوماتای و وا :
ین اتوماتا تنها دارای دو حللت :0 و2 و دوخروجی و0 و02 است.
وأ ودیبه اتوماتا دومقدار( cad (Ve اتوماتا با دریاقت بورودین 1 حالت تقوو
09}
را عوض می کند و با دریافت ورودی ۰ در همان حالت می ماند.
B} , {a,, O}, {C,, C,}, ,,®{
}0,1{
۰ Oe «O
سم > 0
صفحه 42:
1
(نواع (توماتاهای یادکیر با سافتار ثابت
۲- اتوماتای دوجا 5
ان اتومانا تغییر یافته اتوماتای ممااست که دارای2 لا حالت و دو اقدام
خی باشد.
|3
اتوماتای و ابا دريافت جواب نامطلوب به عمل ديكر انتقال مى يافت اما
در لین نوع اتوماتا برای هر عمل تعداد موفقیت ها و شکست ها نگه داری
شده و تنها زملنی تغییر حللت روی می دهد که تعداد شکست ها از تعداد
موفقیت ها بیشتر شود.
©
۵٩ از |
صفحه 43:
(نواع [توماتاهای یادکیر با سافتار ثابت
در این اتوماتا حالات ,2 ,492,۰۰۰ Dy, مربوط به اقدام 0 و حالات
برع ,۰۰ بعبیر موبیو مربوط به اقدام له است.
2 2-1 ۱+3 2+1
پاسخ مطلوب 8-0
0 7 ياغ نامطلوب 6-1
صفحه 44:
1
۱ (نواع [توماتاهای یادگیر با سانتار ثابت
۳- اتوماتای کرینسکی Krinsky)
رفتار این اتوماتا در برابر پاسخ مطلوب. حللت Dj به ازای لا...,1,2-)به حللت و40 می رود و در
جلت ,4 به ازاى (/2.,..,20+/1,8+/8)-1 به حللت ربیر تغيير مى یابد. اين اتومتا برای پاسخ
تإمطلوب مانند اتوماتاى دروأ مى كند.
1
صفحه 45:
(نواع [توماتاهای یادگیر با سانتار ثابت
man مرو جویی
مبهبو.-- و ۲ هبو
»N failures are needed to have a state
change
۵٩ از ©
صفحه 46:
(نواع [توماتاهای یادگیر با سانتار ثابت
۴- اتوماتای کرایلوف (۲۷۱۵۷):
این اتوماتا برای پاسخ مطلوب asl اتوماتای وپریاعمل می کند. اما با
ٌشاهده پاسخ نامطلوب از محیط با احتمال ۰/۵ از حالت 0 که
1,2 +۶1,۱۱,۱1 )_ به حالت عبرم و یا در می رود.
5 وو 0.5
ال طخت تن
1 2 2۳ 2211-1 ۲+2 +1
b=1
۵٩ از ©
صفحه 47:
» When Automaton encountered with a failure,Each
state ®, is changed to © with probability 2 or to
©,, with probability ۰
صفحه 48:
[توماتای یادگیر با سافتار متغیر
یک اتوماتای یادگیر با ساختار متفییر به صورت زیر تعریف می شود:
LA = {a,b,p,T,c}
م
]4 ما مدرزة وقاع - ةسمه عمل مد
Da, Dabo برط 4 D= مجموعه ورودیها
* (مم ,...,روم ,رم 4 > م بردار لحتطإإنتخابهط
* [(0)م,(م)ط,(م) ]1 > (0+1)م : 1 الكوييتم يادكيرى
* ل[ ,...,رو© ,ره > © مجموعه لحتطزهاوجريمه.
win teal gg وبا الم سم دهم
۱
۵٩ از
صفحه 49:
(توهاتاى يادكير با ساثتار متغير
*اكر عمل 0 در مرحله 1١ انتخاب و محيط ياسخ مطلوب بدهد
a ۱ 22 :.
احتمال "* افزایش و سایر احتمالات کاهش می یابد. اگر محیط پاسخ
PHD کاهش و سایر احتمالات افزایش می یابد.
"در هر حال,تفییرات بگونهای صورت میپذیرد که حاصل جمع تمام
(0) ,۵ ها همواره برابر با ۱ است.
© نل
صفحه 50:
ویژگیهای [توماتاهای بادگیر
#برای استفاده از اتوماتای یادگیر در یک کاربرد باید ویژگی های بنیادی
۳
i اتوماتاهای یادگیر و طبیعت کاربرد را با هم در نظر گرفت.
wooayzoid
7 اتوماتاهای یادگیر با دارا بودن ویژگیهای اسلاید بعد به عنوان ابزار
قدرتمندی در حل بسیاری از مسائل استفاده گردیده است.
.. 2
صفحه 51:
ویزگیهای (توماتاهای پادگیر
۱- اتوماتاهای یادگیر در شرایطی که هیچگونه اطلاعاتی در دسترس نیست به خوبی
عمل م ى ani
۲- اتوماتاهای يادكير براى بهبود وضعيت خود در هر مرحله به يك بازخورد ساده از
محیظط نیازردارند.
wooayzoud iin
۳- اتوماتاهای یادگیر به عنوان مدلی برای یادگیری در محیطهای توزیعشده و چند
عامله با ارتباطات محدود و اطلاعات ناقص بسیار کارساز هستند.
"2 - اتوماتاهای یادگیر در شرایطی که عدم اطمینان وجود دارد دارای عملکرد خوبی
م باقتفقه
صفحه 52:
ویژگیهای [توماتاهای بادگیر
7 ۵- اتوماتاهای یادگیر عمل جستجو را در فضای احتمال انجام میدهند.
۶- اتوماتاهای یادگیر ساختاری ساده دارند و به همین دلیل به سادگی در نرمافزار یا
سختافزار قابل پیادهساژی هستند.
0
7 ۷- اتوماتاهای یادگیر دارای بار محاسباتی بسیار کم میباشند و به همین دلیل به
سادگی در کاربردهای بلادرنگ قابل استفاده میباشند.
صفحه 53:
ویزکیهای (توماتاهای پادکیر
از طرف دیگر استفاده از اتوماتاهای یادگیر در کاربردهایی مفید است که یک یا چند
خصوصیت زیر را درا باشند:
۱- کاربرد به اندازمی کافی پیچیده و نامطمئن باشد به طوریکه یک مدل ریاضی برای
آن موجود نباشد.
مق وجوین
7 - کاربرد قابلیت کنترل توزیمی و مدل سازی توسط مجموعهای از عامل های
خودمختار را داشته باشد.
2 ۳- سیگنال تقویتی یک متفیر تصادفی باشد و بر اساس معیار کارایی تولید گردد.
صفحه 54:
ویزگیهای (توماتاهای یادگیر
ع بهبود کمی در کارایی مورد نظر صرفهی اقتصادی بالایی داشته باشد.
3
گرم 58 7 ah geal:
3 الگوریتم قطعی برای کاربرد مورد نظر وجود نداشته باشد.
©
صفحه 55:
متدودیت ها (توماتاهای یادگیر
- اتوماتاهای یادگیر از اطلاعات اولیهی کمی استفاده میکنند و اطلاعات
اضافی دربارهی محیط هميشه در اتوماتاهای یادگیر قابل استفاده نمیباشد.
اال وجو لني
۲- نرخ همگرایی اتوماتاهای یادگیر برای بسیار از کاربردها پایین میباشد.
۷- اتوماتاهای یادگیر مدل های غیر متداعی میباشند.
۵٩ از ©
صفحه 56:
(توماتای بادگیر توزیع شده
۱ 7 اتوماتای یادگیر توزیع شده (01۵) . شبکهای از اتوماتاهای یادگیر است که
ٍ برای حل یک مساله با یکدیگر همکاری می نمایند.
هت
مد
تعداد اقدامهای یک اتوملتا در ماه برابر تعداد اتوماتاهای یادگیر متصل
۱ به این اتوماتای یادگیر می باشد.
| *انتخاب یک اقدام توسط یک اتوماتای یادگیر در شبکه. اتوماتای یادگیر
متناظر با اين اقدام را فعال مى سازد.
صفحه 57:
(توماتای یادگیر توزیم شده
0 مثال: اتوماتای یادگیر توزیع شده (01۵) با ۳ اتوماتا ی یادگیر
woo'ayzardmnn
..
صفحه 58:
(توماتای یادکیر توزیع شده
در شکل قبل هر اتوماتا یادگیر دارای دو اقدام می باشد.
و
خاب اقدام ۵ توسط , اتوملتا يادكير دل را فعال خواهد کرد.
انوماای یادگیر فعال شده (یاطاسپس یکی از اقدامهای خود را انتخاب می
کند که در نتیجه آن یکی از اتوماتاهای یادگیر متصل به آن اتوماتاى يادكير
که متناظر با اقدام انتخاب شده می باشد فعال می شود. در هر زمان فقط یک
توماتای یادگیر در شبکه فعال میباشد.
۵٩ از ©
صفحه 59:
جموعه اتوماتاهای یادگیر و (] تعداد اتوماتاهای یادگیر در ها و ۵
اعه لبههای گراف می باشده تعریف کرد.
بو
8 وخ
برل ,1) اقدام [ اتوملتا ى يادكير فلس را نشان می دهد. ازملنی فعال خواهد شد
که اقدام j اتاماتاى يادكير بكم انتخاب شود. تعداد اقدامهاى اتوماتاى يادكير وأضيط
( 2:۰۰ *) برابردرجهی خروجی گره متنظر با اتوماتای یادگیر مى باشد.
(توماتای یادکیر توزیع شده
7 بطور رسمی cles |, DLA توسط كراف V= (0A, £4.04) as DEA = (VE)
صفحه 60:
woo'ayzardmnn