صفحه 1:
هوش مصنوعي
boxe خصانه
صفحه 2:
هوش مصنوعي Artificial Intelligence
ست
#بازیها جيستند و جرا مطالعه
ميشوند؟
# انواع بازیها
#الگوریتم ۲۱۱۱۳۱۵۷
#بازیهای چند نفره
#هرس آلفا-بتا
#بازیهای قطعی با اطلاعات
تافص
صفحه 3:
جستجوی خصمانه
بازی ها چیستند و چرا مطالعه میشوند؟
#بازيها حالتى از ممیطهای چند عاملی هستند
>هر عامل نياز به در نظر گرفتن سایر عاملها و چگونکی و
> تمايز بين محيطهاى جند عامل رقابتي و همكار
> محيطهاى رقابتى. كه در آنها اهداف عاملها با يكديكر برخورد دارند. منجر به
مسئله هاى خصمانه ميشود كه به عنوان بازى شناخته ميشوند
»هرا مطالعه ميشون؟>
” >قابليتهاى هوشمندى انسانها ر! به كار ميكيرند
> ماهيت انتزاعى بازى ها
>هالت sil را به راحتى ميتوان نمايش داد و عاملها معمولا به مجموعه كويكى
از فعاليتها محدود هستند كه نتايج آنها با قوانين دقيقي تعريف شده اند
صفحه 4:
جستجوی خصمانه
تصادفی
تخته نرد
پوکر
انواع بازی ها
bs
شطرنج
(یورسی
اطلاعات کامل
اطلاعات ناقص
صفحه 5:
جستجوی خصمانه
یک نمونه بازی
۲ بازی دو نفره: Max 9 Min
“اول »1/13 مرکت میکند و سپس به نوبت بازی میکنند تا بازی تمام شود
*در پایان بازی, برنده جایزه و بازنده جریمه میشود
#بازى به عنوان یک جستجو:
؟* مالت اولیه: موقعیت صفحه و شناسه های قابل مرکت
*تابع جانشین:لیستی از (مالت,مرکت) که معرف یک مرکت معتبر است
> آزمون هدف:پایان بازی چه موقع است؟(مالتهای پایانه)
؟ تابع سودمندی: برای هر حالت چایانه یک مقدار عددی را ارائه میکند. مثلا
برنده(1+) و بازنده(1-)
»هالت اوليه و حركات معتبر براى هر بازیکن, درفت بازی را برای آن بازی
ایجاد میکند
صفحه 6:
جستجوی خصمانه
یک نمونه بازی
axon ۳
الگوریتم؛
"بازیکن: انتخاب بهترین 1 1 ]51 7 7
هالت و لب mel
"هریف: انتفاب بهترین 0 ۵ ۳
5 ید
موقعیت برای خودش یا
بدترین وضعیت برای 21
بازیکن ۱ لد از مسر
بازیکن: ماکزیمم حالت | ل ا
نم كم داد
مریف: مینیمم مالت Bata ۱
ity tt
صفحه 7:
جستجوی خصمانه
الگوریتم minimax
Max
MIN
صفحه 8:
جستجوی خصمانه
یک نمونه بازی
MAX 23
MIN
صفحه 9:
جستجوی خصمانه
یک نمونه بازی
MAX
MIN
صفحه 10:
MAX
MIN
صفحه 11:
MAX.
MIN
صفحه 12:
جستجوی خصمانه
یک نمونه بازی
MAX
MIN
صفحه 13:
جستجوی خصمانه
الگوریتم ۲۳۱۱۲۱۱۲۲۱۵۱
کامل بودن: بله (اگر درخت محدود باشد)
بهينگي: بله
بيجيدكي زمانى: )0
پیهیدگی O(bm wa
صفحه 14:
جستجوی خصمانه
بازیهای چند نفره
# تخصیص یک پردار به هر گره. به جای یک مقدار
بازیهای چند نفره معولاً شامل اتماد رسمی یا غیر رسمي بین بازیکنان
است
+ اتحاد با ييشروى بازى ايجاد و از بين ميرود fio move:
+ بازيكنان بطور خودكار ميكننج. تا به هدف مطلوب انحصارى برسنه
)5,4,5( )1,5,2 )6.1,2( 6۴ ۱,2) 6
A
(12,6) (4.2.3 (612) (4-1) Gate 615.2) 77-1) (5.4.5)
صفحه 15:
جستجوی خصمانه
هرس الفا-بتا
MaxMin @iy)95)1 ys
تعداد حالتهای بازی که باید بررسی شوند. بر هسب تعداد حبکتها, توانی است 4
> راه هل: محاسبه تصمیم الگوریتم. بدون دیدن همه گره ها امکانپذیر است
هرس آلفا -یتا:
له انشعابهايي که در تصمیم نهايي تأثير ندارند را حذف میکند
> آلفا: مقدار ب انتغاب در هر نقطه انتغاب در مسیر Max 09556
> بتاء مقدار بهترين انتخاب در هر نقطه انتخاب در مسير ١/1 تاكنون.
> تعداد گره هايي كه بايد بررسى شوند ay 004/3 تقليل فيابد
> فاكتور انشعاب مؤثر به جای 9 برابر با جذرط خواهد بود
> ييش بيني آن نسبت به 111111073 دو برابر است
صفحه 16:
جستجوی خصمانه
هرس آلفا-بتا
#گره که هر جای درخت میتواند باشد
بررسي میشود اکن
اکر بازیکن انتغاب بهتبی داشته باشد
Opponent كره والد م p<
YS هر انتخاب بهتری تا کنون
4 هیچوقتهر ب ازیولقعیق ابلیسترس
ن فولهد یود رد۳
»در نتيجه 11 هرس ميشود Opponent
صفحه 17:
صفحه 18:
صفحه 19:
صفحه 20:
MAX
MIN
صفحه 21:
جستجوی خصمانه
مثال: هرس آلفا-بتا
MAX
MIN
صفحه 22:
جستجوی خصمانه
مثال: هرس آلفا-بتا
MAX
صفحه 23:
جستجوی خصمانه
مثال: هرس آلفا-بتا
MAX
5 94 ۷7 ,د ۲ ]9,9
MIN
صفحه 24:
جستجوی خصمانه
مثال: هرس آلفا-بتا
MAX pol
MIN [9,9]
صفحه 25:
جستجوی خصمانه
مثال: هرس آلفا-بتا
MAX
MIN [9,9]
صفحه 26:
جستجوی خصمانه
بازیهای قطعي با اطلاعات ناقص
معایب الگوریتم های پیشین
#الگوریتم 11715073 كل فضای جست و جوی بازی را تولید میکند
الکوریتم آلفا-بتا با وجود هرس درخت. اما کل مسیر حالتهای پایانه. هداقل
براى بخشي از فضاى حالت. بايد جست و جو شود
>اين عمق عملي نيست. زيرا حركات بايد در زمانى معقول انجام شود
شانون(1950)
براى كمتر شدن زمان جست و جو و اعمال تابع ارزيابي اكتشافى به حالتهاى
جستجو. بهتر است از كره هاى غير يايانه به كره هاى يايانه يرداخته شود
صفحه 27:
جستجوی خصمانه
بازیهای قطعي با اطلاعات ناقص
# در شانون, :0۱6۱۴۲۵ و آلفا-بتا به دو روش بطور متناوب عمل
a
# جايگزيني تابع سودمندی با تابع ارزیابی اکتشافی بنام ۴۷۸۱
تخمینی از سودمندی موقعیت ارائه میکند
جایگزین تست پایانه با تست توقف
>*تصمیم میگیرد 6۷۸۵۱ چه موقع اعمال شود
صفحه 28:
جستجوی خصمانه
تابع ارزيابي اکتشافی 2۷۸۱
# تابع ارزیابی, ارائه تخمینی از سودمندی مورد انتظار بازی از یک موقعیت خاص
> توابع اکتشافی. تخمینی از فاصله تا هدف را بر میگرداندند
اغلب توابع ارزيابي. خواص گوناگونی از حالتها را محاسبه میکنند
*خواص روی هم رفته. کلاسهای هم ارزی یا دسته های مختلفی از حالتها را تعریف میکنند
* مالتهای هر دسته. برای تمام خواص مقدار یکسانی دارند
#7 هر دسته حاوی چند حالت است که
>*موجب برنده شدن
*مومب رسم شدن
>*منجر به بافتن
تابع ارزیابی نمیداند کدام حالت منجر به چه چیزی میشود. اما میتواند مقداری
برگرداند که تناسب حالتها را با هر نتیجه نشان دهد
صفحه 29:
#غلب توابع ارزیابی, مقدار
عددی جداگانه ای برای هر خاصیتر
محاسبه, سپس آنها را ترکیب.
میکنند تا مقدار کل بدست آید
در تابع بازی شطرنع:
علد ( تابع بازی شطرنج:
تعداد هر نوع قطعه در صفهه
مقادیر آن قطعات(1 برای
پیاده. 3 برای اسب یا فیل.5 برای
)698(
Eval(s) = w, f(s) + w,6(s) + ... +
w F(s)
صفحه 30:
جستجوی خصمانه
مثال: تابع املاع
ارزیابی تابع 2۶۷۸۵1 از مقدار پیروزی در دو موقعيت كاملا متفاوت
الف) سیاه. مزیت اسب و دو پیاده دارد و بازي را میبرد
ب) يس اذ اينكه سفيد. وزير را در اختيار ميكيرد. سياه ميبازد
صفحه 31:
389%( بوجود مي آید که برنامه با
اثری از رقیب مواجه شود که منجر
به خبابی جدی گشته و اجتناب پذیر
است
>مثال: شکل مقابل؛
سیاه در اصل جلوست. اما اگر سفید
پیاده اش را از سطر هفتم به هشتم
apy پیاده به وزیر تبدیل میشود و
موقعیت برد برای سفید بوجود مي
آيد
صفحه 32:
جستجوی خصمانه
بازيهايي که حاوی عنصر شانس هستند