صفحه 1:
الگوریتم هاي جستجوي آگاهانه تهیه کننده: عبدالرضا ميرزابي

صفحه 2:
سرفصل مطالب آلا جستجوي اول‌بهترین ‎Ml‏ جستجوي حریصانه جستجوي ‎“A‏ ‏#ا جسحجوى ‎4A‏ حافظله محدوه لا جستجوي عمیق کننده تكراري ۸ آلا جستجوي اول بهترین بازگشتی(۳۸۵ 88 ۳ 251/۸ ‎Ml‏ هيوربستيك ها ‏الگوریتم هاي جستجوي محلي لا جستجوي 20062۱9 0عاهابامزو ‎Hl‏ الگوریتم هاي ژنتيك لا جستجوي ‎online‏ ‏2 هي تنج ‎ ‏كامبيوتر

صفحه 3:
مروز جستجوى درجت ‎function GENERAL-SEARCH( problem, strategy) returns a solution , or failure‏ initialize the search tree using the initial state of problem loop do if there are no candidates for expansion then return failure choose a leaf node for expansion according to sérategy if the node contains the goal state then return the corresponding solution else expand the node and add the resulting node to the search tree end * استراتژي توسط ترتیب گسترش یافتن گره ها تعریف مي شود.

صفحه 4:
تختتتقوی اول رین نمونه اي از ‎i‏ عمومي ‎graph-search | tree-search‏ است که در ان یک گره بر آساس یک تابع ارزيابي (00)] براي گسترش انتخاب می شود. * تابع ارزيابي ‎evaluation function‏ تخمین "میزان مطلوب بودن " گره * هربار مطلوب ترین گره گسترش نيافته را بسط مي دهد. ۳ پیاده سازی: * گره ها در ‎a fringe‏ ترتیب نزولي میزان مطلوبیت مرتب مي شوند. * يك صف اولويت * حالت هاي خاص جستجوي حریصانه 56۲۳6 6۲660 * جستجوي ۵« ‎ea 4‏ تون من وق زیر

صفحه 5:
جستجوي اول بهترین حریصانه 1 تبع هيوريستيك (0 ‎gies Rape”‏ مسیر از گره 9 تا نزدیکترین گره هدف * براي مثال. در نة نقشه روماني مي توان مسیر از هر شهري به بخارست را از طریق مسافت يك خط مستقیم از آن شهر به بخارست SF geass ‎Ne p(N)‏ ف اضله مستقیم‌از 9 تاب خارست جستجوي اول -بهترين حريصانه * جستجوي حريصانه كره اي را كسترش مي دهد كه به نظر مي رسد نزديكترين كره به هدف ( بخارست) باشد. * تابع ارزيابي (8)0 -(1)0 ‏صتعتي اصفهان دانشکد ‎ ‎

صفحه 6:
نقشه رومانی به همراه هزینه مراحل برحسب ۱۲۰ ‘Straight-line distance ا 0. ‏سوه‎ ‘Bucharest Arad ‏مهد‎ ‎Bocharest 0 Craiova Dobreta Eforie Fagaras 176 Ginrgin 7 vast Blirsowa Ist 26 24 ‏اب‎ ‏بح‎ ‎300 ‏مور‎ 30, 193 as 253 ‘Timisoara ‏ود‎ ‏م تا‎ ‏مروت‎ Vashi ‏ها‎ ‎Zerind 274

صفحه 7:
جستجوي اول -بهترین حربصانه

صفحه 8:
تسحجوق اول «بيعرين حويصانة ‎aD‏ هع ‎32 we

صفحه 9:
Male Ae, al eee ‏كد‎ .

صفحه 10:
جستجوي اول بهترین حریصانه D> =D ED ‏هه‎ G> => Sb DP-Gichaes 252

صفحه 11:
خواص جستجوي اول -بهترین حریصانه * کال -خیر (ممکن است در حلقه بینهایت گیر کند) پيچيدگي زماني؟ (0)8 -لمابا ی کهیوریستیکخوبم یت ولند به شدتب هود یابد * پیچیدگی حافطه؟ ‎La oF plas O(b™) -‏ را در حافظه نگه می دارد. ‏بهینه؟ ‏- خیر (مثلا در مثال قبل مسیر بهینه اي وجود دارد که از دید جستجوي حریصانه مخفي مي ماند). ‎ ‎lye gute 11‏ دنک ‎

صفحه 12:
حلقه بینهایت در جستجوي حریصانه ‘Straight-line distance Bucharest Arad ‏معد‎ ‎Bucharest 6 Craiova para 253 30 و 374 ‎Neamt [)‏ ن أكقا ن] غمصقعلة [] أ5ها ‎12 ‏كامبيوتر ‎

صفحه 13:
A ‏جستجوي‎ * ایده: از گسترش مسيرهايي که تاکنون مشخص شده پرهزینه م باشس» جاب كن. * تابع ارزيابي

صفحه 14:

صفحه 15:

صفحه 16:

صفحه 17:

صفحه 18:
سیب

صفحه 19:

صفحه 20:
هيوربستيك قابل قبول * يك هيوريستيك (0)0 قابل قبول است اگر براي هر گره 0 داشته باشیم : *؟ ‎A(n) s h’(n)‏ * که (۲0/ هزینه واقعي براي رسیدن به هدف از گره 0] مي باشد. * يك هيوريستيك قابل قبول هرگز هزینه رسیدن به هدف را بیش از حد تخمین نمي زند. يعني خوش بینانه است. * مثال: هيوريستيك(0)م,و0ا هیچگاه فاصله را بیش از حد واقعي تخمین نمي زند. * ثضبه: اگر (0)0 قابل قبول باشد. ۵* با استفاده از ۲8۴6-5۴6۸86۷ بهینه است 20

صفحه 21:
اثبات بهينگي ‎"A‏ ‏* فرض کنید يك جواب زیر بهینه مانند و5) ایجاد شده و در ۲۲۱096 قرار دارد. همچنین فرض کنید 9 يك گره گسترش نیافته روي کوتاهترین Start مسير به هدف بهینه ) باشد. 3 ce ۱ 9 f(G,) = g(G,) since A(G,) = 0 g(G,) > g(G) since G, is suboptimal f(G) = 9(G) since A(G) = 0 f(G,) > f(G) from above 21

صفحه 22:
۳ ۰ اثبات بهینگی ۸ فا ۳ * فرض كنيد يك جواب زير بهینه مانند وق) ایجاد شده و در ۲1096 قرار دارد. همچنین فرض کنید 9 يك گره گسترش نیافته روي کوتاهترین 6 ‏مسير به هدف بهینه ) باشد.‎ © OG, f(G,) > f(G) from above h(n) << h*(n) since h is admissible g(n) + h(n) = g(n) + h(n) f(n) = f(G) ‏چون (۲)۳ < (و6))؟ است ۰۸ هیچگاه رت را براي گسترش انتخاب نمي کند‎ 22 انشکده دانشگاه صنمتي اء و كامييوتر

صفحه 23:
* اگر به جای1865-56۸861 از 68۵۳۳-5۲۵86 استفاده کنیم. آنگاه * ممکن است راه حلهای نیمه بهینه برگردانده شوند. زیرا -68۵۲ 58۸06 می تواند میسر بهینه به يك حالت تکراری را کنار بگذارده اگز اولین گره توليدي نباشد. * دو راهكار براي حل اين مشكل: * اولین راه حل, این است که 68۵۴۳۱5۳۸86۱ را به نحوي توسعه بدهيم که از بین مسيري که به يك گره مي رسد آن مسيري که پرهزینه تر است را کنار بگذارد. این روش فضاي زيادي آشغال مي کند. اما بهينگي را تضمین مي کند. راه حل دوم. اطمینان از این موضوع است که مسیر بهینه به هر حالت تكراري» هميشه اولین مسيري است که دنبال مي شود. شرط سازگاري (يا يکنواختي) 23 دانشگاه صنعتي اسف كامبيوتر

صفحه 24:
‎See ۱‏ هاي سازگار ‏* يك هيوريستيك سازگار ونم است اگر (0 + (9(ق) >( ‎ ‏۶ شكلي از قانون كلي نامساوي مثلث است که تصریح مي کند هیچ ضلعي از يك مثلث نمي تواند بلندتر از مجموع دو ضلع دیگر باشد. ‏* هر هيوريستيك سازگا قابل قبول نیز هست. ‏* تضبه: اگر (۱)۳ سازكار باشد. 8* با استفاده از 8011 مع 1-5]ط م08 امك ‏دانشگاه صتعتي اصفهان دانشکده بر و کر ‎

صفحه 25:
هیوربستیک هاي سازگار كاه (0)] در طول هر مسيريء غيرنزولي است. كط + )د د رمم Fas) + ola’) h(t) nr) * اگر (0) سازگار باشد (۲ + (و < = F(a) ‏ان نتیجه گرفت که رشته اي از ی ل‎ 8 ‏كسترش يافته اند به ترتيب غيرنزولي (1)0 مي‎ 68/681- SEARCH باشد. * در نتيجه. اولين كره هدفي كه براي كسترش انتخاب مي شود بايد يك راه حل بهينه باشد. زيرا تمامى كره هاي بعدي حداقل به همان اندازه هزينة وخواهند داشت. دانشگاه صتعتي اصفهان دانشکده

صفحه 26:

صفحه 27:
5 . * * اولین راه حل پیداشده باید يك راه حل بهينه باشد * زیرا گره های هدف در تمامی ۲لا00010هاي ‎cae‏ داراي هزینه ؟ بيشتري خواهند بود و در نتیجه هزينة ت) بالاتري نیز دارند (زیرا ‎cle oF oli‏ هدف داراي ۱)0(<0] هستند). * جستجوی ۵۸* کامل است. * همان طور که نوارهاي با ۴ در حال افزایش را اضافه می کنیم. باید بالاخره به نواري برسیم که در آنجا ] مساوي هزينة مسیر تا يك حالت هدف است. 27

صفحه 28:
‎“A 5 | ۰‏ ‎oie‏ ‏-بله. مگر اينکه تعدادی نامحدود گره با (۴)63 > ۴ وجود داشته باشد. ‎*A‏ در گراف هاي متناهی محلی ( با فاکتور انشعاب محدود) ‎AIS‏ ‏مى باشد : ي پيچيدگي زماني؟ = نمايي ‎Wi Fis ©‏ - نمايي تمام گره ها را در حافظه نگه مي دارد. ‎

صفحه 29:
“A 5 les ‏بهينه؟‎ * ‏بله نمی تواند وبر] را گسترش دهد مگر آنکه ] تمام شده باشد.‎ - ‏تمام گرم ها با > (۲)۳* را گسترش‌می‌دهد.‎ 7*۸ ‏برخي‌گره ها با 2 (۲0* را گسترش‌مي‌دهد.‎ 7 ۸ ‏هرگز گره لیب ا]< (200* را گسترش ن مي‌دهد.‎ - ۸ ‏دارلي‌كارلييهینه 65۳61606 00۲1۳0۵۷۱ مي_اشد‎ *۵ * ‏يعني هیچ الگوریتم بهينة ديگري تضمین نمي کند که تعداد گره هايي‎ * گسترش می دهد از ۸۵* کمتر باشد. * علت این امر آن است که هر الگوریتمی که تمامی گره ها را با > (۴)۳* را گسترش ندهد خطر از دست دادن راه حل بهینه را دارد. 29

صفحه 30:
جستجوی ۸" با حافظه محدود * زمان محاسبه نقطه ضعف اصلی ۵" نیست. ‎gals aay Sil saliasieal gh‏ کوو‌های لد هدر خافطظه نگهداري مي کند معمولا بسیار بیشتر از آنکه وقت کم بیاورد. حافظه کم می آورد. ‏* در مورد بسياري از مسائل بزرگ, عملي نيست. ‏* چند راه حل برای مسأله حافظه در ۸۵ * جستجوي عمیق کننده تكراري ‎AX (IDA*)‏ * جستجوي اول‌بهترین بازگشتي(88۴5) 7 جستجوي (ساده شده) ‎*A‏ با حافظه محدود («6‌شظل ‎30 ‏كامبيوتر ‎

صفحه 31:
‘IDA ‏ايدة استفاده از راهكار عميق كننده تكراري در زمينة جستجوي‎ * ‏آكاهانه‎ ‎*IDA ‏تفاوت اصلي بین 25| و‎ * ‏محدوده عمقی از محدوده ؟ (یعنی +9) استفاده‎ we 4 AIDA ‏در‎ * ‏مي شود.‎ ‏سر هر تگرا سار بر یی شمرین ریما سیر ماه‎ * ‏هايي است که از برش تکرار قبلي بیشتر باشند.‎ 31

صفحه 32:
جستجوي اول -بهترین بازگشتي (۴8۴5) * يك الگوریتم بازگشتي با فضاي خطي که سعي مي کند از جستجوي اول- بهترین استاندارد تقلید کند. ساختار ‎٩58۳5‏ مشابه جستجوی اول عمق باز است. اما به جای ادامه دادن مسیر فعلي به طور نامشخص, خود را از مقدار بهترین ؟ مسیر جایگزین قابل دسترس از تمام اجداد گره فعلي مطلع نگه می دارد. اگر گره فعلي از این محدوده فراتر رود. تابع بازگشت برمي گرداند تا روي يك مسیر جایگزین دیگر قرار گیرد. در بازگشت به عقب مقدار ‏ مربوط به هر گره موجود در مسیر را با بهترین مقدار ] فرزندانش جایگزین مي کند. بتابراين رن مجددرآتیچه فعلي هون مفعکن هي بان 32 آن را به عقب دانشگاه صتعتي اصفهان دانشکده برق و کامپپوتر

صفحه 33:
جستجوي اول -بهترين بازكشتي ‎(RBFS)‏ function RECURSIVE-BEST-FIRST-SEARCH(prob/eui) return a solution or failure return RFBS(problemMAKE-NODE(INITIAL-STATE[problen]).0) function RFBS( problem, node, f limit return a sobtion or failure and a new if GOAL-TEST[probleai(STATE[zode)) then return uode successors EXPAND(siode, problem) if successorsis empty then retwn failure, © for each sin successors do ۶] > ‏دقع )حمس‎ + INS), Muode)) repeat best — the lowest £value node in successors if f[best| > £ Limit then return failure, ‏لعف‎ ‎alremative — the second lowest fvalue among successors result, f[bes — RBFS(problem, best, min(f limit, altemative)) if result = failure then return ‏ار‎ 33 دانشگاه

صفحه 34:
جستجوي اول -بهترين بازكشتي (11815) ۱۱۳ Zerind 447 449 Arad Fagaras Oradea 646 415 526 Craiova Pitesti Sibiu 34 دانشگاه

صفحه 35:
, جستجوي اول بهترین بازگشتي ‎(RBFS)‏ Zerind Arad 646 Sibiu Bucharest 591 450 35

صفحه 36:
$53 Craiova 65 Arad Fagaras Oradea 646 450 526 Craiova 526 nichares} 418 اه صتعتي اصفهان دانشکده برق و کامپپوتر

صفحه 37:
‎“IDAs sis .SRBFS *‏ ميباشد - هنوز ک ترش اضافي گره ها وجود دارد( تغییر عقیده) ‎fae hast 2‏ 55 يدگي زماني آن نسبتاً شک است: هم به دقت تابع هيوريستيك بستگي ‏دارد وهم به آين كه در حين كسترش ره هاء بهترين مسير هر جند وقت يكبار تغيير مى کند. ‎ ‏- مانند 08]|* در معرض افزايش نمايي بيجيدكي زماني قرار دارد * پیچیدگی حافظه؟ ‎O(bd) -‏ بهینه؟ - همانند ۰*۸۵ الگوریتم 88۳5 نیز يك الگوریتم بهینه است اگر تابع هيوريستيك ‎1١‏ ‏قابل قبول باشد. 37 ‎

صفحه 38:
غواض جستجري 8815 ۰ 88۴6و ۱0۸+ هرد * ممکن است در معرض افزایش نمايي بالقوه در پيچيدگي همراه با جستجو در گرافها قرار بگیرند. ‎ .‏ * آنها نمي توانند حالتهاي تكراري. به جز آنهايي را که بر روي مسیر فعلي قرار دارند بررسي کنند. در نتیجه. ممکن است يك حالت را چندین بار اکتشاف کنند. از میزان بسیار کم حافظه ‎Dey‏ ‎scl, bi SIDA *‏ را نكهداريميكند (محدوديتمقدار فعلي)) ‏* 8۳5 لطاهاتتب یشتریا در حافظه نكهداييميكد ولوفقطاز ‎O(bd)‏ ‏حافظه لستفادم میک ند. ‎mo‏ ۱ ‎ ‎38 ‏توانند از آن استفاده ‎ ‎

صفحه 39:
*Memory Bounded A (Simplified) ‏]لس استفاده از تمامي حافظه موجود‎ ۱ 7 يعني, گسترش بهترین گره هاي برگي تا زماني که حافظه موجود پر شود. * ۸ دقیقامنل۸* عملمی‌کنده یعنیتا نمانی‌که حافظه پر شود. بسهترین‌گره را گسترش‌مي‌دهد. ۱ در صورت پر شدن حافظه هميشه بدترین گره برگي (گرهي با بیشترین مقدار ۴) را از حافظه حذف می کند * اطلاعات گره هاي فراموش شده را در پدرشان ذخیره مي کند 39

صفحه 40:
*Memory Bounded A (Simplified) “SMA * * کامل است. اگر راه حل دست يافتني وجود داشته باشد (يعني اگر عمق کم عمقترین گره هدف کمتر از اندازة حافظه باشد). * این الگوریتم بهینه است در صورتي که راه حل بهينة دست يافتني وجود داشته باشد. در غیر این صورت بهترین راه حل دستيافتني را برمي گرداند. ۱ 40

صفحه 41:
هيوريستيك هاي قابل قبول * مثال براي پازل 8 تايي: ۰ تعداد کاشيهايي‌که در جاي‌شود قرار ن_گرفته لند. ‎hy‏ مجموع ف ولصلفقيو عمودي‌کاشیها از موقعيتهاي‌هدفشان(ف اصله ‎janhattan L, city block‏ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‏5 5 2 1 هر دو قابل قبول 5 4 3 8 7 6 ‏8 > (كايط و + 2ج 2ع 1ع وه رقي 41 ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 42:
اگر بازاء هر ۱ داشته باشیم (/, = (2)0/(و هر دو هيوريستيك قابل قبول باشند) آنگاه 2 بر 1( تسلط دارد و براي * مثال هزینه جستجو: تعداد گره های تولید شده در عمق های مختلف: ۱ 0212 * ‎IDS = 3,644,035 nodes‏ ‎A‘(h,) = 227 nodes‏ ‎A‘(h,) = 73 nodes‏ ‎d=24‏ * ‎IDS = too many nodes‏ ‎A‘(h,) = 39,135 nodes‏ ‎A‘(h,) = 1,641 nodes‏ 42

صفحه 43:
ضریب انشعاب موثر 0" ضریب انشعاب موثر:(5۳ع) اگر تعداد گره هاي گسترش يافته توسط روال جستجو لا و عمق راه حل 0 باشد 0 به صورت زیر محاسبه مي شود: )+ ... +(#ی) + 1+0 ع ۸+1 مثال: اگر ۸۵* راه حلي را در عم 5 با استفاده از 52 گره پیدا کند. ضریب انشعاب موثر؟ 53 = 1+ b* + (b*)? +...(b*)> b* = 1.92 ‏در يك هيوريستيك هر چه فاکتور انشعاب به يك نزدیکتر باشد. بهتر است‎ * آن هيوريستيك کیفیت کشف کنندگي بيشتري دارد. 43 كامبيوتر

صفحه 44:
رابطه بین هزینه جستجو و ضریب انشعاب موثر At(h) 179 44 (A) 179 148 148 1.48 Effective Branching Factor Ips 2.45 28 وله Search Cost At)

صفحه 45:
ابداع توابع هيوريستيك * مسأله اي که تعداد کمتري محدودیت براي اقدامات دارد. يك مسألةتعدیل شده ۲61260 ناميده مى * هزينة يك راه حل بهینه براي يك مسألة تعدیل شده؛ يك هیوریستیک قابل قبول براي مسأّلة اصلی است. هزینه راه حل بهینه يك مسأله تعديل شده. بیشتر از هزینه راه حل بهینه در مسأله واقعي نیست. * مثال: پازل 8 تایی. يك کاشی می تواند از خانه ۸ به خانه 8 برود اگر ۸ مجاور 8 باشد و 8 خالی باشد. - 45

صفحه 46:
ابداع توابع هيوريستيك * مثال: پازل 8 تايي. يك كاشي مي تواند از خانه ۸ به خانه 8 برود اگر ۸۸ مجاور 8 باشد و خالي باشد. ميتوانیم با خذف يك پا هر دو شرط سه مسألة تفترای حتاف تولید ‎ied‏ ‏* يك كاشى مى تواند از خانه ‎a A‏ خانه 8 برود اگر ۵ مجاور 8 باشد. ‎(A)‏ ‏* يك كاشى مى تواند از خانه 8 به خانه 8 برود اكر 8 خالى باشد. * يك كاشى مى تواند از خانه 8 به خانه 8 برود. ‎ )52(‏ - 46

صفحه 47:
الگوریتم هاي حستجوي محلي و مسائل بهینه سازي در بسياري از مسائل بهینه سازي» مسیر راه حل اهمیت ندارد؛ خود خالت هدف پاسخ مسأله می باشد. * فضاي حالت - مجموعه پیکره بندي هاي کامل 5 هدف - يافتن يك ييكره بندي كه محدوديت هاي مسأله را ارضاء کند. مانند مساله 0- وزير * در چنین مواردي مي توان از الگوریتم هاي جستجوي محلي بهره گرفت. * يك حالت "فعلي ” را به تنهايي در نظر بگیر؛ سعي کن آن را ‎sete‏ 47

صفحه 48:
الگوریتم هاي حستجوي محلي و مسائل بهینه سازي * جستجوي محلي - استفاده از يك حالت فعلي و حرکت به حالت هاي همسایه * مزایا: - استفاده از حافظه بسیار کم 7 یافتن راه حل هاي معقول در اغلب موارد در فضاهاي حالت بزرگ و یا نامحدود * مفید براي مسائل بهینه سازي محض < یافتن بهترین حالت بر طبق تابع هدف ‎(objective function)‏ 48

صفحه 49:
State space landscape | * يك 130056306 هم شامل "محل" (كه توسط حالت تعريف مي شود) و هم شامل "ارتفاع" (كه توسط مقدار تابع هيوريستيك هزينه يا تابع هدف تعريف مي شود) مي باشد. ° اكر ارتفاع متناظر هزينه باشدء آنكاه هدف يافتن عميقترين دره (يك کمينة سراسري) است و اگر ارتفاع متناظر با تابع هدف باشد. آنگاه هدف یافتن بلندترین قله (يك بيشينة سراسري) است. * يك الگوریتم جستجوي محلي کامل. هدف را (در صورت وجود) پیدا مي کند ‎lial palette! cao ely gs gel dh‏ 49 كامبيوتر

صفحه 50:
State space landscape objective function Bisbal maxis local maxinmm “flat” local maximmm cunent state Forel yp oS lye gate ts 50

صفحه 51:
تيه نوردي( يا كراديان صعودي /نزولي) * الكوريتم جستجوي تيه نوردي فقط از يك حلقه تشكيز مي شود كه مدام در جهت افزايش مقدار حركت مي كند (يعني به سمت بالاي تيه). * الگوریتم هنگامي خانمه پیدا مي کند که به قلّه اي برسد که در آنا هیچ همسایه اي مقدار بيشتري نداشته باشد. ۶ این الگوریتم. درخت جستجو را نگهداري نمي کند. بنابراین» ساختمان دادة گره فعلي تنها نیاز به ثبت حالت و مقدار تابع هدفش را دارد. تيه نوردی. فراتر از همسایه های مجاور حالت فعلی را نگاه نمی کند. 51

صفحه 52:
تبه نوردي( با گرادیان صعودي انزولي) 52 function ‏عتما د ماع (ماامم )نت11۲‎ that is a local maximum inputs: probiers, a problem local variables: current, a node neighbor, a node current — Maxe-Nove(Inrtan-Stare|probleri)) loop do neighbor +a highest-valued successor of current if Varcr|neighbor] < Vatunfeurrent] then return StatE[currend] current — neighbor

صفحه 53:
مثال: 19-وزير ‎١‏ وزیر را در یك‌صفحه شطرنج!۲ * ‎N‏ به كونهلوقرار بدم که هیچ دو وزیریدر یك‌سطر ستونو یاقطر قرار نگيرند. ‏8- وزیر: ‏* فرمول بندي حالت کامل: هر حالت شامل 8 وزیر يعني يکي در هر ستون ‏* تابع پسین همه حالتهاي ممكني که با جابجايي یک وزیر به مربع ديگري در همان ستون تولید مي شود را برمي گرداند. هر حالت 7*8 پسین دارد ‏* تابع هيوريستيك!] تعداد جفتهايي از وزبرهاست که چه به صورت مستقیم و چه غیر مستقیم در حال حمله به یکدیگر هستند. ‏* كمينة سراسري این تابع صفر است که فقط در راه حل کامل اتفاق مي افتد. ‎53 ‎

صفحه 54:
بهترین پسین داراي ۱212 است. 1111 1 1 1 54

صفحه 55:
۴ تبه نوردي اغلب به دلايل زير كير مي كند: * بیشینه هاي محلي: الگوريتمهاي تپه نوردي که به همسايگي يك محلي مي ر ندء رو به بالا به ت قله شیده مي شوند. ولي بس از أن كير مي كنند و جاي ديگري نمي روند. ‎Ridge *‏ دارلييكيشته بيشينة محليهستد كه كذشتراز لنها ب ولا گوریتمهاي‌حریصب سیر مشکللیست * فلاتها: فلات ناحیه اي از دورنماي فضاي حالت است که در آن تابع اززیاب: ثابت ‎cal‏ فلات مى توائد محلی مسطح باشد که از آن هیچ مسیر رو به بالايي وجود ندارد یا يك شانه باشد که از آن بتوان به بالاتر هم رفت. 55

صفحه 56:
انواع ديكر تيه نوردي * تپه نوردي انفاقي ‎stochastic hill climbing‏ * به صورت تصادفي از میان حركتهاي رو به بالا يكي را انتخاب مي کند. * احتمال این انتخاب مي تواند براساس شیب حركتهاي رو به بالا تغییر کند. * اين روش معمولا کندتر از تیزترین شیب به نتیجه مي رسد. اما در بعضی از ۱30056306 هاي حالت. بهترین راه حل را پیدا می کند. 57

صفحه 57:
انواع ديكر تبه نوردي * تیه نوردی ‎first choice hill climbing «is 5° al‏ * تبه نوردي اتفاقي را به كار مي كيرد به اين صورت كه به صورت تصادفي يسين توليد مي كند تا زماني كه يسيني توليد شود كه از حالت فعلي بهتر باشد. این راهبرد هنگامي مناسب است که يك حالت داراي تعداد زيادي (مثلاً هزار) پسین باشد. * تیه نوردی با شروع مجدد تصادفي ۲۱ ۲65۱۵۲۲ ۲3۲00۳0 ‎climbing‏ ‏* يك مجموعه جستجوي تپه نوردي را از حالتهاي شروع تصادفي اجرا مي کند و هنگامي که يك هدف پیدا شد متوقف ميشود. این روش با احتمال نزديك به يك. کامل مي باشد. 58

صفحه 58:
سردسازي شبیه سازي شده التوريتم نبه نوردي كه هركز حركت رو به پایین به سمت حالتهايي با مقادیر کمتر (با هزينة بالاتر) را انجام نمی دهد. ناکامل بودنش قطعي است. زیرا ممکن است در يك بيشينة محلي گیر کند. * در مقابل» يك راهييمابي كاملا تصادفي ‎walk‏ 800000( يعني حركت به پسيني که از مجموعة ‎gas,‏ به طور يكتواعت و كاملة تصادفي انتخاب شده است) کامل ولي به شدت ناكا رآمد مي باشد. در نتيجهء تلاش در جهت تركيب تيه نوردي با يك راهييماي بي تصادفي که هم کارآمد و هم کامل باشد. کار معقولي به نظر مي رسد. سردسازي شبیه سازي شده. يك چنین الگوريتمي است. 59

صفحه 59:
سردسازي شبیه سازي شده Simulated Annealing :ow! * ۲ 9 ‏مات‎ ۶ . ‏از ماكزيمم هاي محلي با اجام حريكت هاي به قرار كن‎ ‏اما به تدريج اندازه و تعداد حركات بد ( به سمت يايين) را كم كن‎ * function SiMULATED-ANNHALING( problem, schedule) reburns a solution state inputs: problem a problem schedule, a mapping from time to “temperature” local variables: current, anode next, anode 7 a “temperature” controling prob. of downward steps current Maxe-Nonn(|vrrtat-Starefprobierd) for t+ 1 t0 00 do Te schedule if P= 0 then return current neat a randomly selected successor of current Abe Vaturfneat] ~ VaLunfeurent] if AF > O thon current nezt else current « nezt only with probability ‏كك‎ 7 60 داشگاه تمتي اسان دا

صفحه 60:
سردسازي شبیه سازي شده وی مانند تپه نوردی می باشد اما در هر مرحله حالت بعدي به طور تصادفی انتخاب مي شود. اگر حالت بعدي انتخاب شده بهتر باشد. همواره به آن حالت بعدي خواهیم رفت. * در غیر این صورت. تنها با يك احتمال به آن حالت خواهيم رفت و این انختمال به ضورت تمايي کاهش مي یابد: ‎val *‏ احشاز م ‎e AE/T Tatas”‏ * میزان کاهش در هر مرحله :۸۴ 61 دانشگاه صنعتي |

صفحه 61:
خواص جستجوي ‎SA‏ * در مقادیر بالاتر] احتمال انجام حرکات بد (رفتن به سمت پایین) بیشتر است (مانند جستجوي تصادفي رفتار مي کند). * با کاهش ۲ این احتمال کاهش يافته و در 10 این احتمال به صفر مي رسد. ( مانند تبه نوردي رفتار مي كند) * هی توانن تابن کرد که آگو ۲ بهءافناژه کاقی آرام کاجشی یابتبا احتمال نزدیک به یک 5 یک پاسخ بهینه را خواهد یافت. 62

صفحه 62:
جستجوی پر توی ‎Local Beam Search (leo‏ * شروع با ا حالت که به طور تصادفی ایجاد شده اند. * در هر تکرار, تمام فرزندان براي هر حالت تولید مي شوند. اگر يكي از آنها حالت هدف بود جستجو متوقف مي شود و در غیر این صورت از میان لیست کامل فرزندان > تا از بهترین ها انتخاب مي شوند و مرحله بالا تکرار مي شود. تفاوت با جستجوي با شروع مجدد تصادفي * در يك جستجوي با شروع مجدد تصادفي, هر فرآیند جستجو به طورمستقل از بقیه اجرا مي شود. * در يك جستجوي پرتوي محلي, اطلاعات سودمند در بین 1 جستجوي موازي رد و بدل مي گردد. 63

صفحه 63:
جستجوي پر توي اتفاقي ‎Stochastic beam‏ searc rch. * مشکل جستجوي پرتوي محلي * این روش ممکن است از نبود تنوع بین ۷ حالت رنج ببرد. به سرعت تمامي آنها در محدوده كوچكي از فضاي حالت جمع شوند. * جستجوي پرتوي اتفاقي * به جاي انتخاب > بهترین از مجموعه پسينهاي منتخب 6 پسین را به صورت تصادفی انتخاب کند. * احتمال انتخاب هر پسین خاص تابعي از بازندگي آن * الگوریتم ژنتیک * نمونه اي از جستجوي پرتوي اتفافي که تولید حالتهاي پسین علاوه بر تغییر يك حالت. از ترکیب دو حالت والد نیز (ترکیب جنسي) انجام مي شود. 64

صفحه 64:
function GENETIC-ALGORITHM( populztion. FITNESS-FN) returns an individual Input: population, a set of individuals FITNESS-FN. a function that measures the fitness of an individual repeat new_population <— empty set loop for {from 1 to SIZE(populatiou) do x RANDOM SELECTION(populetion, FITNESS FN) ¥y —RANDOM_ SELECTION (population. FITNESS FN) child REPRODUCE(s,) if (small random probability) then cfd —MUTATE( child) add chifd'to new population population <— new population until some individual is fit enough or enough time has elapsed return the best individual in population, according to FITNESS-FN 65 تعود دي تمتوان وار

صفحه 65:
مثال الگوربتم ژنتیک: 10 7 وزیر ]32742 [-| 32748552 / وت | 24748552 ‎La 247148552 24752413 |—+| 24752411‏ 32752411 32124 |+— | 32752124 | 327523111 2% 20 | 24415124 244151011310 | “24415124 14% 11 | 32543213 fay oe) 8 ۵ 0 Initial Population Fitness Function Selection Cioss-Over ‘Mutation * تابع برازندگي : تعداد جفت وزیر هايي که یکدیگر را تهدید نمي کنند. (مینیمم: صفره ماکزیمم: 28-7/2*8) ۴ 24+23+20+11)124( = 31% 24+23+20+11)/23( = 29% Forel yp oS lye gate ts 66

صفحه 66:
مثال الگوریتم ژنتیک: 90 7 وزیر 67 داشگ صنمتي اسان دنه بق و ‎Forel‏

صفحه 67:
جستجوی 0۳1۳6 * تا کنون تمام الگوریتم هاي مطرح شده 0۴۲11۲16 بودند. ‎al, Offline °‏ حلقبااز اجولیآنم عیراست * 001106 محاسبه و عمل صويتيكدر ميان * جستجوي 001106 براي محیط هاي پویا و نيمه پویا ضروري مي باشد * در نظر گرفتن تمامي امکان هاي مختلف غير ممکن است اننتفادهنشدهدر مسائل اکتشافی * حالت ها و اعمال ناشناخته 7 * مثال: يك روبات در يك محیط جدید. يك نوزاد و .. 68 نشگاه صتعتي اصفهان دانشکد

صفحه 68:
مسائل جستجوی 0۳۱116 ‎a‏ دانش عامل: * عمل (ها): لیست اعمال مجاز در حالت 5 * تابع هزینه گام « پس از تعیین 5) (5 ,2 ,05 ‎GOAL-TEST(s) *‏ * فرضیات ۶ عامل مي تواند حالت قبلي را تش تشخیص دهد * اعمال قطعي هست: * دستيابي به هيوربستيك قابل قبول (9)5 69

صفحه 69:
مسائل جستجوي 0۳1106 * هدف: رسیدن به حالت هدف با حداقل هزینه * هزینه - کل هزینه مسیر پیموده شده با هزینه مسیر راه حل در ‎IE‏ ‏که فضای جستجو شناخته شده باشد 5 نسبت رقابتي - مقایسه * می تواند نا محدود باشد * مثلا در مواردي که عامل به طور تصادفي به يك بن بست مي رسد 9 فضاي حالت قابل کاوش امن * از هر حالت دست يافتني حداقل یک حالت هدف قابل دسترس باشد * مثلا فضاهاي حالت با اقدامات قابل برگشت 25350005 70

صفحه 70:
مسائل جستجوي 0۳1106 ‎Mal |S‏ ی ‎i‏ | ۹ ۳ 5 * حالت ها ملاقات شده ۵ و 5 حالت بعدی؟ * در يكي از فضاهاي حالت شکست مي خورد ‏* هيج الگوريتمي نمي تواند از بن بست ها در تمامي فضاهاي حالت اجتناب کند ‎71 ‎

صفحه 71:
مسائل جستجوي 0۳1106 Y sal SA es 1 3 ‏اي‎ 5 9 ‏ااا‎ ‎1 | ‏هو‎ ves N\A ‏وس‎ يك محیط 2 بعدي را تصور کنید که حریف قادر است در حين کاوش ‎glad pole‏ حالت را بسازد ‏* باعث مي شود یک کارگزار جستجوي برخط یک مسیر اجبارا ناکارامد را به سمت هدف دنبال كند. 00 ‎ ‏72 داشگ صنمتي اسان دنه بق و ‎Forel‏

صفحه 72:
کارگزارهاي جستجوي 0۳116 ۶ عامل يك نقشه از محيط نگهداري مي کند 7 نقشه بر اساس ورودي ادراكي بهنگام مي شود - از این نقشه براي انتخاب عمل بعدي استفاده مي شود * به تفاوت مثلا با ۸* دقت کنید ۱ * يك نسخه 001/06 تنها مي تواند گره اي را گسترش دهد که به طور فيزيكي در آن قرار داشته باشد. * براي اجتناب از جابجايي در عرض درخت بهتر است گره ها را به ترتب معلي کستوش دهیم. مثلا جستجوي اول عمق. جستجوي وه 73

صفحه 73:
کار گزارجستجوي 01016 با کاوش اول عمق function ONLINE-DFS-AGENT(s) returns an action input: 57 a percept identifying current state static: resnfta table indexed by action and state, initially empty tmexplored, a table that lists for each visited state, the action not yet tried unbackiracked, « table 1 sa, the previous state and action, initially null I lists for each visited state, the backtrack not yet tried if GOAL-TEST(s) then return stop ]۱ state then unexplored's |< ACTIONS(s) if sis not null then do resulf.as] — 8° add sto the front of nnhackedtracked 5] if uueaplored.s is empty then if unbackirackedd sis empty then return stop else a an action bsuch that resid, s]-POP(unbackrracked s]) else a POP(uexplored’s 1) ses ose ‏معي‎ 4

صفحه 74:
جستجوي محلي ‎online‏ * جستجوي تپه نوردي 01۱11116 مي باشدا! * يك حالت ذخیره شده است ۶ عملکرد بد به دلیل وجود ماکزیمم های محلی * شروع مجدد تصادفی غیر ممکن است * راهکار 1: گام برداشتن تصادفی ‎random walk‏ * یکی از اقدامات موجود حالت فعلی را به صورت تصادفی تولید * مي توان به اقداماتي که تا کنون امتحان نشده اند احتمال بالاتري داد. 75

صفحه 75:
جستجوی محلی ‎online‏ ‏* گام برداشتن تصادفي !۷۷۵ ۲3000 * اگر فضا متناهي باشد گام برداشتن تصادفي در نهایت یک هدف را يبدا مي كند يأ کاوشهایش را کامل مي کند. * این فرایند ممکن است خيلي کند باشد ( مي تواند حالات بسياري را به صورت نمايي تولید کند) 76

صفحه 76:
جستجوی محلی ‎online‏ راهکار 2: اضافه نمودن حافظه به تپه نورد * ذخیره بهترین تخمین فعلي ( 5 از هزینه رسیدن به هدف ۴ (۲۱65 در لبتتا تخمين‌هيوريستيك (5) مي‌باشد. * يس از آن بر اساس تجربه بهنگام مي شود. * هزینه تخميني رسیدن به هدف از طریق همسایه اي مانند 5" هزینه رسیدن به 5 " به علاوه ي هزینه ي تخميني رسیدن به هدف از انجاست يعني ('11)5+ ('5,83,5)© 77

صفحه 77:
*Learning real-time A apf BY 1 PNA a <P 8 ‏هل(‎ aoe ‏تس بل 2( 2 رفيا‎ fe Nok ‏ما‎ = 1 => 8 9۱ ‏دص(‎ )3( ‘ale ‎oot (3)‏ 0 ۲ بت ‏= حر 2 ‎PN og fT‏ ‎pare‏ پم ‎L(A) jae‏ تم و )سلم( و /جله ‎Nef es ee ee ‏ی‎ ‎ont 9 ‏و نا‎ as 3) Dome 0 ‎ ‎ ‎78 ‎1 ‎(a) ‎(b) ‎© ‎@

صفحه 78:
*Learning real-time A function LRTA*-COST (s, 4 $77) return on cost estanate if 5°15 undefined the return ii) else return o(s 2, 5)+ Als] function LRTA*-AGENT (s} return an action Input: 5” a pescept identifying eusent stare Static: zesul, table mdexed by action and state, mally empty H,atable of cost estimates indexad by state, initially empty sa the provious state and action, ‏اه اور‎ ifGOAL. TEST (5) then return siop ifs 15 anew state (uot m A) then As] Ls) unless sis null resus] 5 Hfs] © MIN LRTA'-COST (6, ‏]ملعم بن‎ 3, 10 be ACTIONS (9) 2am action bin ACTIONS (s)) that minimizes LRTA* COST (7 6 resuit[6. 51. 2 79

صفحه 79:
يادگيري در جستجوي 0۳1186 * نتیجه هر اقدام در هر حالت * در محيطهاي معین تنها یک تجربه براي هر اقدام كافي است * براوردهاي دقیق تر از ارزش هر حالت * با استفاده از قوانین به روزاوري محلي مشابه 81 1* * به مجرد تعیین دقي * يادگيري مفهوم اعمال * اقدام ملا مختصات ۲ را افزايش مي دهد مگر اينکه ديواري بر سر راه قرار داشته باشد. مقادیر تپه نوردي محض راهبرد بهینه است. 55 80

الگوريتم هاي جستجوي آگاهانه تهيه کننده :عبدالرضا ميرزايي دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر سرفصل مطالب جستجوي اول-بهترين جستجوي حريصانه جستجوي *A جستجوي *Aحافظه محدود جستجوي عميق كننده تكرا-ري*A جستجوي اول بهترين بازگشتي()*RBFA *SMA هيوريستيك ها الگوريتم هاي جستجوي محلي جستجوي simulated annealing الگوريتم هاي ژنتيك جستجوي online 2 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مرور :جستجوي درخت • استراتژي توسط ترتيب گسترش يافتن گره ها تعريف مي شود. 3 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين • نمونه اي از الگوريتم عمومي tree-searchيا graph-search است که در ان يک گره بر اساس يک تابع ارزيابي ) f(nبراي گسترش انتخاب مي شود. • تابع ارزيابي evaluation functionتخمين ”ميزان مطلوب بودن“ گره • هربار مطلوب ترين گره گسترش نيافته را بسط مي دهد. • پياده سازي: • گره ها در fringeبه ترتيب نزولي ميزان مطلوبيت مرتب مي شوند. • يك صف اولويت • حالت هاي خاص • جستجوي حريصانه Greedy search 4 • جستجوي *A دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين حريصانه • تابع هيوريستيك )h(n • هزينة تخميني مسير از گره nتا نزديکترين گره هدف • براي مثال ،در نقشه روماني مي توان هزينة مسير از هر شهري به بخارست را از طريق مسافت يك خط مستقيم از آن شهر به بخارست تخمين زد. ) hSLD(nف--اص-له م-ستقيم از nت--ا ب--خار-س-ت جستجوي اول -بهترين حريص-انه 5 • جستجوي حريصانه گره اي را گسترش مي دهد كه به نظر مي رسد نزديكترين گره به هدف ( بخارست) باشد. • تابع ارزيابي )f(n)= h(n دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر نقشه روماني به همراه هزينه مراحل برحسب km 6 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين حريصانه جستجوي اول -بهترين حريصانه جستجوي اول -بهترين حريصانه جستجوي اول -بهترين حريصانه خواص جستجوي اول -بهترين حريصانه • • • • كامل؟ –خير (ممکن است در حلقه بينهايت گير کند) پيچيدگي زماني؟ ) – O(bmا-ما ب--ا ي--که-يور-ي-ستيکخ-وبم-يت--وا-ند ب--ه ش--دتب--هبود ي--ابد پيچيدگي حافظه؟ – ) O(bmتمام گره ها را در حافظه نگه مي دارد. بهينه؟ – خير (مثال در مثال قبل مسير بهينه اي وجود دارد که از ديد جستجوي حريصانه مخفي مي ماند). 11 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر حلقه بينهايت در جستجوي حريصانه شروع پايان ‏Iasi  Neamt  Iasi  Neamt  12 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي *A • ايده :از گسترش مسيرهايي كه تاكنون مشخص شده پرهزينه مي باشند ،اجتناب كن. • تابع ارزيابي )f(n) = g(n) + h(n هزينة رسيدن به گره ‏n هزينة تخميني ارزانترين مسير از گره nبه هدف 13 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر هزينة ارزانترين مسير گذرنده از گره nبه هدف مثال جستجوي A * مثال جستجوي A * مثال جستجوي A * مثال جستجوي A * مثال جستجوي A * مثال جستجوي A * هيوريستيك قابل قبول • يك هيوريستيك ) h(nقابل قبول است اگر براي هر گره nداشته باشيم : • )h(n) ≤ h*(n • که ) h*(nهزينه واقعي براي رسيدن به هدف از گره nمي باشد. • يك هيوريستيك قابل قبول هرگز هزينه رسيدن به هدف را بيش از حد تخمين نمي زند ،يعني خوش بينانه است. • مثال :هيوريستيك) hSLD(nهيچگاه فاصله را بيش از حد واقعي تخمين نمي زند. • قضيه :اگر ) h(nقابل قبول باشد *A ،با استفاده از TREE-SEARCH بهينه است 20 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر اثبات بهينگي A * • فرض كنيد يك جواب زير بهينه مانند G2ايجاد شده و در fringeقرار دارد .همچنين فرض کنيد nيك گره گسترش نيافته روي كوتاهترين مسير به هدف بهينه Gباشد. ‏since h(G2) = 0 ‏since G2 is suboptimal ‏since h(G) = 0 ‏from above 21 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر )f(G2) = g(G2 )g(G2) > g(G )f(G) = g(G )f(G2) > f(G اثبات بهينگي A * • فرض كنيد يك جواب زير بهينه مانند G2ايجاد شده و در fringeقرار دارد .همچنين فرض کنيد nيك گره گسترش نيافته روي كوتاهترين مسير به هدف بهينه Gباشد. )f(G2 )> f(G ‏from above )h(n )≤ h*(n ‏since h is admissible )g(n) + h(n )≤ g(n) + h*(n )f(n )≤ f(G چون ) f(G2) > f(nاست *Aهيچگاه G2را براي گسترش انتخاب نمي کند 22 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر بهينگي A * • اگر به جاي TREE–SEARCHاز GRAPH–SEARCHاستفاده كنيم ،آنگاه قضيه قبل ديگر صدق نمي كند. • ممكن است راه حلهاي نيمه بهينه برگردانده شوند ،زيرا –GRAPH SEARCHمي تواند ميسر بهينه به يك حالت تكراري را كنار بگذارد ،اگر اولين گره توليدي نباشد. • دو راهکار براي حل اين مشكل: • اولين راه حل ،اين است كه GRAPH–SEARCHرا به نحوي توسعه بدهيم كه از بين مسيري كه به يك گره مي رسد آن مسيري كه پرهزينه تر است را كنار بگذارد .اين روش فضاي زيادي اشغال مي كند ،اما بهينگي را تضمين مي كند. • راه حل دوم ،اطمينان از اين موضوع است كه مسير بهينه به هر حالت تكراري، هميشه اولين مسيري است كه دنبال مي شود .شرط سازگاري (يا يكنواختي) 23 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر هيوريستيک هاي سازگار • يك هيوريستيك سازگار consistentاست اگر • )'h(n) ≤ c(n,a,n') + h(n • شكلي از قانون كلي نامساوي مثلث است كه تصريح مي كند هيچ ضلعي از يك مثلث نمي تواند بلندتر از مجموع دو ضلع ديگر باشد. • هر هيوريستيك سازگار ،قابل قبول نيز هست. • قضيه :اگر ) h(nسازگار باشد *A ،با استفاده از GRAPH–SEARCH بهينه است 24 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر هيوريستيک هاي سازگار • اگر ) h(nسازگار باشد آنگاه ) f(nدر طول هر مسيري ،غيرنزولي است. )'f(n') = g(n') + h(n )'= g(n) + c(n,a,n') + h(n )≥ g(n) + h(n )= f(n • مي توان نتيجه گرفت كه رشته اي از گره ها كه توسط *Aبا استفاده از GRAPH–SEARCHگسترش يافته اند به ترتيب غيرنزولي ) f(nمي باشد. • در نتيجه ،اولين گره هدفي كه براي گسترش انتخاب مي شود بايد يك راه حل بهينه باشد ،زيرا تمامي گره هاي بعدي حداقل به همان اندازه هزينة 25خواهند داشت. دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر بهينگي A * • *Aب--ه ت--در-ي-ج f-contourها را ا-ضاف-ه م-يک--ند. 26 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي A * • اولين راه حل پيداشده ،بايد يك راه حل بهينه باشد • زيرا گره هاي هدف در تمامي contourهاي بعدي داراي هزينه f بيشتري خواهند بود و در نتيجه هزينة Gباالتري نيز دارند (زيرا تمامي گره هاي هدف داراي h(n)=0هستند). • جستجوي *Aكامل است. • همان طور كه نوارهاي با fدر حال افزايش را اضافه مي كنيم ،بايد باالخره به نواري برسيم كه در آنجا fمساوي هزينة مسير تا يك حالت هدف است. 27 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي A • • • • * كامل؟ –بله ،مگر اينكه تعدادي نامحدود گره با ) f ≤ f(Gوجود داشته باشد. – *Aدر گراف هاي متناهي محلي ( با فاكتور انشعاب محدود) كامل مي باشد پيچيدگي زماني؟ – نمايي پيچيدگي حافظه؟ – نمايي تمام گره ها را در حافظه نگه مي دارد. بهينه؟ – بله 28 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي A * • بهينه؟ – بله نمي تواند fi+1را گسترش دهد مگر آنکه fiتمام شده باشد. – *Aت--مام گ--ره -ها ب--ا *f(n) <fرا گ--سترشم-يد-هد. – *Aب--رخ-يگ--ره -ها ب--ا *f(n) =fرا گ--سترشم-يد-هد. – *Aهرگز گ--ره -ا-يب--ا *f(n) >fرا گ--سترشن--ميد-هد. • *Aدارا-يكارآ-ي-يب--هينه optimally efficientم-يب--اشد • يعني هيچ الگوريتم بهينة ديگري تضمين نمي كند كه تعداد گره هايي كه گسترش مي دهد از *Aكمتر باشد. • علت اين امر آن است كه هر الگوريتمي كه تمامي گره ها را با *f(n) <fرا گسترش ندهد خطر از دست دادن راه حل بهينه را دارد. 29 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي *Aبا حافظه محدود • • • • زمان مح-اسبه ،نقطه ضعف اصلي *Aنيست. از آنجا كه اين الگوريتم ،تمامي گره هاي توليد شده را در حافظه نگهداري مي كند معموالً بسيار بيشتر از آنكه وقت كم بياورد، حافظه كم مي آورد. در مورد بسياري از مسائل بزرگ ،عملي نيست. * چند راه حل براي مسأله حافظه در A • جستجوي عميق كننده تكراري )*A* (IDA • جستجوي اول-بهترين بازگشتي()RBFS • جستجوي (ساده شده) *Aبا حافظه محدود (()*MBA)S 30 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر IDA * • ايدة استفاده از راهکار عميق کننده تكراري در زمينة جستجوي آگاهانه • تفاوت اصلي بين IDSو *IDA • در *IDAبه جاي محدوده عمقي از محدوده ( fيعني )g+hاستفاده مي شود. • در هر تكرار ،مقدار برش ،كوچكترين هزينة fميان تمام گره هايي است که از برش تكرار قبلي بيشتر باشند. 31 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين بازگشتي ()RBFS • • • • • يك الگوريتم بازگشتي با فضاي خطي كه سعي مي كند از جستجوي اول -بهترين استاندارد تقليد كند. ساختار RBFSمشابه جستجوي اول عمق بازگشتي است ،اما به جاي ادامه دادن مسير فعلي به طور نامشخص ،خود را از مقدار بهترين fمسير جايگزين قابل دسترس از تمام اجداد گره فعلي مطلع نگه مي دارد. اگر گره فعلي از اين محدوده فراتر رود ،تابع بازگشتي آن را به عقب برمي گرداند تا روي يك مسير جايگزين ديگر قرار گيرد. در بازگشت به عقب مقدار fمربوط به هر گره موجود در مسير را با بهترين مقدار fفرزندانش جايگزين مي کند. بنابراين گسترش مجدد نتيجه فعلي هنوز ممكن مي باشد. 32 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين بازگشتي ()RBFS 33 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين بازگشتي ()RBFS 34 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين بازگشتي ()RBFS 35 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي اول -بهترين بازگشتي ()RBFS 36 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي RBFS • RBFSكميكارآ-تر از *IDAم-يب--اشد – هنوز گسترش اضافي گره ها وجود دارد( تغيير عقيده) • پيچيدگي زماني؟ – بيان پيچيدگي زماني آن نسبتاً مشكل است :هم به دقت تابع هيوريستيك بستگي دارد و هم به اين كه در حين گسترش گره ها ،بهترين مسير هر چند وقت يكبار تغيير مي كند. – مانند *IDAدر معرض افزايش نمايي پيچيدگي زماني قرار دارد • پيچيدگي حافظه؟ – )O(bd • بهينه؟ – همانند ، *Aالگوريتم RBFSنيز يك الگوريتم بهينه است اگر تابع هيوريستيك h قابل قبول باشد. 37 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي RBFS • • • • RBFSو *IDAهر دو ممكن است در معرض افزايش نمايي بالقوه در پيچيدگي همراه با جستجو در گرافها قرار بگيرند. آنها نمي توانند حالتهاي تكراري ،به جز آنهايي را كه بر روي مسير فعلي قرار دارند بررسي كنند .در نتيجه ،ممكن است يك حالت را چندين بار اكتشاف كنند. از ميزان بسيار كم حافظه رنج مي برند. 38 • *IDAف--قط ي--ك ع-دد را ن--گه-دار-يم-يكند (م-حدود-ي-تم-قدار ف--علي)f • RBFSا-ط-العاتب--يشتريرا در ح-اف-ظه ن--گه-دار-يم-يكند ،و-ل-يف--قط از )O(bd ح-اف-ظه ا-س-تفاد-ه -م-يک--ند. • حتي اگر حافظه بيشتري در دسترس باشد نمي توانند از آن استفاده كنند. دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر (*Memory Bounded A )Simplified ايده :استفاده از تمامي حافظه موجود – يعني ،گسترش بهترين گره هاي برگي تا زماني كه حافظه موجود پر شود. • *SMAد-ق-يقا م-ثل *Aع-ملم-يكند ،ي--عنيت--ا ز-مان-يكه ح-اف-ظه پ--ر ش--ود ،ب--هتري-نگ--ره -را گ--سترشم-يد-هد. • در صورت پر شدن حافظه هميشه بدترين گره برگي (گرهي با بيشترين مقدار )fرا از حافظه حذف مي كند • اطالعات گره هاي فراموش شده را در پدرشان ذخيره مي كند 39 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر (*Memory Bounded A )Simplified • SMA * • كامل است ،اگر راه حل دست يافتني وجود داشته باشد (يعني اگر عمق كم عمقترين گره هدف كمتر از اندازة حافظه باشد). • اين الگوريتم بهينه است در صورتي كه راه حل بهينة دست يافتني وجود داشته باشد .در غير اين صورت بهترين راه حل دستيافتني را برمي گرداند. 40 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر هيوريستيك هاي قابل قبول • مثال براي پازل 8تايي: h1ت--عداد كاش-يه-اي-يكه در ج-ايخ-ود ق-رار ن--گرف-ته ا-ند. ل-ف-قيو ع-مود-يكاش-يها از م-وق-عيتهايهدف-شان(ف--اص-له h2م-جموع ف--وا-ص ا city blockي--ا Manhattan هر دو قابل قبول ‏h1(S) = 8 ‏h2(S) = 3 + 1 + 2 + 2 + 2 + 3 + 3 + 2 = 18 41 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر • اگر بازاء هر nداشته باشيم )(h2(n) ≥ h1(nو هر دو هيوريستيك قابل قبول باشند) آنگاه h2بر h1تسلط دارد و براي جستجو بهتر مي باشد. • مثال هزينه جستجو :تعداد گره هاي توليد شده در عمق هاي مختلف: • d=12 ‏IDS = 3,644,035 nodes ‏A*(h1) = 227 nodes ‏A*(h2) = 73 nodes • d=24 ‏IDS = too many nodes ‏A*(h1) = 39,135 nodes ‏A*(h2) = 1,641 nodes 42 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر ضريب انشعاب موثر b * ضريب انشعاب موثر)EBF(: اگر تعداد گره هاي گسترش يافته توسط روال جستجو Nو عمق راه حل dباشد *bبه صورت زير محاسبه مي شود: ‏N+1 = 1+b* + (b*)2+ … + (b*)d مثال :اگر *Aراه حلي را در عمق 5با استفاده از 52گره پيدا كند ،ضريب انشعاب موثر؟ 53 = 1 + b* + (b*)2 +…(b*)5 ‏b* = 1.92 • در يك هيوريستيك هر چه فاكتور انشعاب به يك نزديكتر باشد ،بهتر است و آن هيوريستيك كيفيت كشف كنندگي بيشتري دارد. 43 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر رابطه بين هزينه جستجو و ضريب انشعاب موثر 44 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر ابداع توابع هيوريستيك • • • • مسأله اي كه تعداد كمتري محدوديت براي اقدامات دارد ،يك مسألةتعديل شده relaxedناميده مي شود. هزينة يك راه حل بهينه براي يك مسألة تعديل شده ،يك هيوريستيک قابل قبول براي مسألة اصلي است. هزينه راه حل بهينه يك مسأله تعديل شده ،بيشتر از هزينه راه حل بهينه در مسأله واقعي نيست. مثال :پازل 8تايي .يك كاشي مي تواند از خانه Aبه خانه Bبرود اگر A مجاور Bباشد و Bخالي باشد. 45 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر ابداع توابع هيوريستيك • مثال :پازل 8تايي .يك كاشي مي تواند از خانه Aبه خانه Bبرود اگر A مجاور Bباشد و Bخالي باشد .ميتوانيم با حذف يك يا هر دو شرط ،سه مسألة تعديل شده توليد كنيم: • يك كاشي مي تواند از خانه Aبه خانه Bبرود اگر Aمجاور Bباشد)h2( . • يك كاشي مي تواند از خانه Aبه خانه Bبرود اگر Bخالي باشد. • يك كاشي مي تواند از خانه Aبه خانه Bبرود)h1( . 46 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر الگوريتم هاي جستجوي محلي و مسائل بهينه سازي • در بسياري از مسائل بهينه سازي ،مسير راه حل اهميت ندارد؛ خود حالت هدف پاسخ مسأله مي باشد. • فضاي حالت = مجموعه پيكره بندي هاي كامل • هدف = يافتن يك پيكره بندي كه محدوديت هاي مسأله را ارضاء كند ،مانند مساله -nوزير • در چنين مواردي مي توان از الگوريتم هاي جستجوي محلي بهره گرفت. • يك حالت ”فعلي“ را به تنهايي در نظر بگير؛ سعي كن آن را بهبود ببخشي. 47 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر الگوريتم هاي جستجوي محلي و مسائل بهينه سازي • جستجوي محلي = استفاده از يك حالت فعلي و حركت به حالت هاي همسايه • مزايا: – استفاده از حافظه بسيار كم – يافتن راه حل هاي معقول در اغلب موارد در فضاهاي حالت بزرگ و يا نامحدود • مفيد براي مسائل بهينه سازي محض – يافتن بهترين حالت بر طبق تابع هدف ()objective function 48 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر State space landscape • يك landscapeهم شامل "محل" (كه توسط حالت تعريف مي شود) و هم شامل "ارتفاع" (كه توسط مقدار تابع هيوريستيک هزينه يا تابع هدف تعريف مي شود) مي باشد. • اگر ارتفاع متناظر هزينه باشد ،آنگاه هدف يافتن عميقترين دره (يك كمينة سراسري) است و اگر ارتفاع متناظر با تابع هدف باشد ،آنگاه هدف يافتن بلندترين قله (يك بيشينة سراسري) است. • يك الگوريتم جستجوي محلي كامل ،هدف را (در صورت وجود) پيدا مي كند و يك الگوريتم بهينه يك كمينه يا بيشينة سراسري را پيدا مي كند. 49 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر State space landscape 50 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر تپه نوردي( يا گراديان صعودي/نزولي) • الگوريتم جستجوي تپه نوردي فقط از يك حلقه تشكيل مي شود كه مدام در جهت افزايش مقدار حركت مي كند (يعني به سمت باالي تپه). • الگوريتم هنگامي خاتمه پيدا مي كند كه به قلّه اي برسد كه در آنجا هيچ همسايه اي مقدار بيشتري نداشته باشد. • اين الگوريتم ،درخت جستجو را نگهداري نمي كند .بنابراين ،ساختمان دادة گره فعلي تنها نياز به ثبت حالت و مقدار تابع هدفش را دارد. • تپه نوردي ،فراتر از همسايه هاي مجاور حالت فعلي را نگاه نمي كند. 51 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر تپه نوردي( يا گراديان صعودي/نزولي) 52 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مثال-n :وزير • nوز-ير را در ي--ك ص--فحه ش--طرن-ج n * nب--ه گ--ون-ه ا-يق-رار ب--ده- كه ه-يچ دو وز-يريدر ي--ك س--طر ،س--تونو ي--ا ق--طر ق-رار ن--گيرند. • -8وزير: • فرمول بندي حالت كامل :هر حالت شامل 8وزير يعني يکي در هر ستون • تابع پسين همه حالتهاي ممکني که با جابجايي يک وزير به مربع ديگ-ري در همان ستون توليد مي شود را برمي گرداند .هر حالت 7*8پسين دارد. • تابع هيوريستيك hتعداد جفتهايي از وزيرهاست كه چه به صورت مستقيم و چه غير مستقيم در حال حمله به يكديگر هستند. • كمينة سراسري اين تابع صفر است كه فقط در راه حل كامل اتفاق مي افتد. 53 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مثال-n :وزير حNرکNت5 ‏h=1 بهترين پسين داراي h=12است 54 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر ‏h=17 تپه نوردي • تپه نوردي اغلب به داليل زير گير مي كند: • بيشينه هاي محلي :الگوريتمهاي تپه نوردي كه به همسايگي يك بيشينة محلي مي رسند ،رو به باال به سمت قلّه كشيده مي شوند، ولي پس از آن گير مي كنند و جاي ديگري نمي روند. • :Ridgeدارا-يي--ك ر-ش-ته ب--يشينة م-حليه-ستند كه گ--ذش-تناز آ-ن-ه-ا تم-شكل-س . ا ب--را-يا--لگور-ي-تمه-ايح-ري-صب--سيار • فالتها :فالت ناحيه اي از دورنماي فضاي حالت است كه در آن تابع ارزياب ،ثابت است .فالت مي تواند يك بيشينة محلي مسطح باشد كه از آن هيچ مسير رو به بااليي وجود ندارد يا يك شانه باشد كه از آن بتوان به باالتر هم رفت. 55 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر انواع ديگر تپه نوردي • تپه نوردي اتفاقي stochastic hill climbing • به صورت تصادفي از ميان حركتهاي رو به باال يكي را انتخاب مي كند. • احتمال اين انتخاب مي تواند براساس شيب حركتهاي رو به باال تغيير كند. • اين روش معموالً كندتر از تيزترين شيب به نتيجه مي رسد ،اما در بعضي از landscapeهاي حالت ،بهترين راه حل را پيدا مي كند. 57 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر انواع ديگر تپه نوردي • تپه نوردي اولين گزينه، ‏first choice hill climbing • تپه نوردي اتفاقي را به كار مي گيرد به اين صورت كه به صورت تصادفي پسين توليد مي كند تا زماني كه پسيني توليد شود كه از حالت فعلي بهتر باشد .اين راهبرد هنگامي مناسب است كه يك حالت داراي تعداد زيادي (مث ً ال هزار) پسين باشد. • تپه نوردي با شروع مجدد تصادفي random restart hill ‏climbing • يك مجموعه جستجوي تپه نوردي را از حالتهاي شروع تصادفي اجرا مي كند و هنگامي كه يك هدف پيدا شد متوقف ميشود .اين روش با احتمال نزديك به يك ،كامل مي باشد. 58 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر سردسازي شبيه سازي شده • • • • الگوريتم تپه نوردي كه هرگز حركت رو به پايين به سمت حالتهايي با مقادير كمتر (يا هزينة باالتر) را انجام نمي دهد ،ناكامل بودنش قطعي است ،زيرا ممكن است در يك بيشينة محلي گير كند. در مقابل ،يك راهپيمايي كام ً ال تصادفي (random walkيعني حركت به پسيني كه از مجموعة پسينها به طور يكنواخت و كام ً ال تصادفي انتخاب شده است) كامل ولي به شدت ناكارآمد مي باشد. در نتيجه ،تالش در جهت تركيب تپه نوردي با يك راهپيمايي تصادفي كه هم كارآمد و هم كامل باشد ،كار معقولي به نظر مي رسد. سردسازي شبيه سازي شده ،يك چنين الگوريتمي است. 59 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر سردسازي شبيه سازي شده • ايده: ‏Simulated Annealing • از ماكزيمم هاي محلي با انجام حركت هاي بد فرار كن. • اما به تدريج اندازه و تعداد حركات بد ( به سمت پايين) را كم كن 60 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر سردسازي شبيه سازي شده • • • • پيشروي مانند تپه نوردي مي باشد ،اما در هر مرحله حالت بعدي به طور تصادفي انتخاب مي شود. اگر حالت بعدي انتخاب شده بهتر باشد ،همواره به آن حالت بعدي خواهيم رفت. در غير اين صورت ،تنها با يك احتمال به آن حالت خواهيم رفت و اين احتمال به صورت نمايي كاهش مي يابد. تابع احتمال: • دما T: • ميزان كاهش در هر مرحله ΔE: 61 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر خواص جستجوي SA • در مقادير باالتر Tاحتمال انجام حركات بد (رفتن به سمت پايين) بيشتر است (مانند جستجوي تصادفي رفتار مي كند). • با كاهش Tاين احتمال كاهش يافته و در T=0اين احتمال به صفر مي رسد ( .مانند تپه نوردي رفتار مي كند) • مي توان ثابت کرد که اگر Tبه اندازه کافي آرام کاهش يابد با احتمال نزديک به يک SAيک پاسخ بهينه را خواهد يافت. 62 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي پرتوي محلي • • • • • ‏Local Beam Search شروع با kحالت كه به طور تصادفي ايجاد شده اند. در هر تكرار ،تمام فرزندان براي هر kحالت توليد مي شوند. اگر يكي از آنها حالت هدف بود جستجو متوقف مي شود و در غير اين صورت از ميان ليست كامل فرزندان kتا از بهترين ها انتخاب مي شوند و مرحله باال تكرار مي شود. تفاوت با جستجوي با شروع مجدد تصادفي • در يك جستجوي با شروع مجدد تصادفي ،هر فرآيند جستجو به طورمستقل از بقيه اجرا مي شود. • در يك جستجوي پرتوي محلي ،اطالعات سودمند در بين kجستجوي موازي رد و بدل مي گردد. 63 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي پرتوي اتفاقي ‏Stochastic beam ‏search • مشکل جستجوي پرتوي محلي • اين روش ممکن است از نبود تنوع بين kحالت رنج ببرد .به سرعت تمامي آنها در محدوده کوچکي از فضاي حالت جمع شوند. • جستجوي پرتوي اتفاقي • به جاي انتخاب kبهترين از مجموعه پسينهاي منتخب kپسين را به صورت تصادفي انتخاب کند. • احتمال انتخاب هر پسين خاص تابعي از برازندگي آن • الگوريتم ژنتيک • نمونه اي از جستجوي پرتوي اتفاقي که توليد حالتهاي پسين عالوه بر تغيير يك حالت ،از تركيب دو حالت والد نيز (تركيب جنسي) انجام مي شود. 64 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر الگوريتم ژنتيک 65 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مثال الگوريتم ژنتيک – n :وزير • تابع برازندگي :تعداد جفت وزير هايي كه يكديگر را تهديد نمي كنند( .مينيمم :صفر ،ماكزيمم)28=7/2*8 : • 31% = )24+23+20+11(/24 66 29% = )24+23+20+11(/23 … دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مثال الگوريتم ژنتيک – n :وزير عملگر 67 ‏Crossover دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي online • تا كنون تمام الگوريتم هاي مطرح شده offlineبودند. م-عين-س-ت • Offlineرا-ه -ح-لق--بلاز ا-جرا-يآ-ن ا ت--ك در م-يان• Onlineم-حاس-به و ع-ملب--صور ي • جستجوي onlineبراي محيط هاي پويا و نيمه پويا ضروري مي باشد • در نظر گرفتن تمامي امكان هاي مختلف غير ممكن است • استفاده شده در مسائل اكتشافي • حالت ها و اعمال ناشناخته • مثال :يك روبات در يك محيط جديد ،يك نوزاد و ... 68 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مسائل جستجوي online • دانش عامل: • عمل (ها) :ليست اعمال مجاز در حالت s • تابع هزينه گام ( پس از تعيين c(s, a, s’) )’s • )GOAL-TEST(s • فرضيات • عامل مي تواند حالت قبلي را تشخيص دهد • اعمال قطعي هستند • دستيابي به هيوريستيك قابل قبول )h(s 69 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مسائل جستجوي online • هدف :رسيدن به حالت هدف با حداقل هزينه • هزينه = كل هزينه مسير پيموده شده • نسبت رقابتي = مقايسه هزينه با هزينه مسير راه حل در حالتي كه فضاي جستجو شناخته شده باشد • مي تواند نا محدود باشد • مثال در مواردي كه عامل به طور تصادفي به يك بن بست مي رسد • فضاي حالت قابل کاوش امن • از هر حالت دست يافتني حداقل يک حالت هدف قابل دسترس باشد • مثال فضاهاي حالت با اقدامات قابل برگشت 70 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مسائل جستجوي online • حالت هاي مالقات شده Aو Sحالت بعدي؟ • در يكي از فضاهاي حالت شكست مي خورد • هيچ الگوريتمي نمي تواند از بن بست ها در تمامي فضاهاي حالت اجتناب كند 71 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر مسائل جستجوي online • يك محيط 2بعدي را تصور كنيد كه حريف قادر است در حين كاوش عامل فضاي حالت را بسازد • باعث مي شود يک کارگزار جستجوي برخط يک مسير اجبارا ناکارامد را به سمت هدف دنبال کند. 72 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر کارگزارهاي جستجوي online • عامل يك نقشه از محيط نگهداري مي كند – نقشه بر اساس ورودي ادراكي بهنگام مي شود – از اين نقشه براي انتخاب عمل بعدي استفاده مي شود • به تفاوت مثال با *Aدقت كنيد • يك نسخه onlineتنها مي تواند گره اي را گسترش دهد كه به طور فيزيكي در آن قرار داشته باشد. • براي اجتناب از جابجايي در عرض درخت بهتر است گره ها را به ترتيب محلي گسترش دهيم .مثال جستجوي اول عمق ،جستجوي محلي و ... 73 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر کارگزارجستجوي onlineبا کاوش اول عمق 74 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي محلي online • جستجوي تپه نوردي onlineمي باشد!!! • يك حالت ذخيره شده است • عملكرد بد به دليل وجود ماكزيمم هاي محلي • شروع مجدد تصادفي غير ممكن است • راهکار :1گام برداشتن تصادفي random walk • يکي از اقدامات موجود حالت فعلي را به صورت تصادفي توليد ميکند. • مي توان به اقداماتي که تا کنون امتحان نشده اند احتمال باالتري داد. 75 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي محلي online • گام برداشتن تصادفي random walk • اگر فضا متناهي باشد گام برداشتن تصادفي در نهايت يک هدف را پيدا مي کند يا کاوشهايش را کامل مي کند. • اين فرايند ممکن است خيلي کند باشد ( مي تواند حاالت بسياري را به صورت نمايي توليد كند) 76 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر جستجوي محلي online • راهکار :2اضافه نمودن حافظه به تپه نورد • • • • 77 ذخيره بهترين تخمين فعلي ) H(sاز هزينه رسيدن به هدف ) H(sدر ا-ب-تدا ت--خمينه-يور-ي-ستيك ) h(sم-يب--اشد. پس از آن بر اساس تجربه بهنگام مي شود. هزينه تخميني رسيدن به هدف از طريق همسايه اي مانند ،’s هزينه رسيدن به ’sبه عالوه ي هزينه ي تخميني رسيدن به هدف از انجاست يعني )’c(s,a,s’)+H(s دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر *Learning real-time A 78 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر *Learning real-time A 79 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر يادگيري در جستجوي online • نقشه محيط • نتيجه هر اقدام در هر حالت • در محيطهاي معين تنها يک تجربه براي هر اقدام کافي است • براوردهاي دقيق تر از ارزش هر حالت • با استفاده از قوانين به روزاوري محلي مشابه *LRTA • به مجرد تعيين دقيق مقادير تپه نوردي محض راهبرد بهينه است. • يادگيري مفهوم اعمال • اقدام upمختصات Yرا افزايش مي دهد مگر اينکه ديواري بر سر راه قرار داشته باشد. 80 دانشگاه صنعتي اصفهان دانشکده برق و کامپيوتر

62,000 تومان