صفحه 1:
SYSTEM DYNAMIC
4
GAME THEORY
هدیه پولادخان ۰ ۸۹۶۷۳۰۷۶
ماندانا حاجی حسینی ۸۹۶۷۳۱۰۲
استاد راهنما: جناب آقای دکتر شهانقی
صفحه 2:
فهرست:
۱)مروری بر تلوری بازیها و بازیهای استفاده شده در مقالات
مقایسه پسویاییهایسیستم با تسئوویب ازیها و عللت رکیبلینهتدها(2
")بررسي مقالات
نمونه کار لنجام شده (4
صفحه 3:
* در یک بازی با گروهی از بازیکن ها سر وکار داریم که هر یک کوشش دارند دریافت
Pay-ofh +2 ,| به حداکثر برسانند. لذا هر بازیکن در هنگام تصمیم گیری برای
حرکت بهینه خویش باید کلیه واکنش های ممکن بازیکنان دیگر را نسبت به حرکت
خود در نظر گیرد. وی حرکات بازیکنان دیگر را با قطعیت نمی داند. اما باید درباره
حرکت خویش با نوعی توجیه عقلانی تصمیم گیری کند(7] 01061 78). لذا جستجو
برای تصمیم عقلانی نوعی تصمیم گیری در حالت عدم قطعیت به شمار م ی آید.
* برای هر بازی سه امر ضروری است:
الف- بازیکنان
ب- استراتژی های بازیکنان که تحت قواعد بازی مجاز
ج- مطلوبيتها يا دريافتها
صفحه 4:
(Nash Equilibrium): yi folds
* تعادل( 0۷0110100170): در تعادل هر بازیکن ن استراتژی را بکار میگیرد که
بهترین پاسخ به استراتژیهای انتخابی سایر بازیکنان باشد. در تعادل لزوماً همه چیز برای
بازیکنان در بهترین حللت نیست. به عبارت دیگر در تعادل لزوما بازیکنان به بیشترین پیامد
dg مستت :ويا تم یکمعید
* یک نفطه تعادل نش است اگر هر بازیکن بهترین پاسخ خودش را پیدا کند.یعنی هیچ کدام
از بازیکنان تمایلی به تغییر استراتژی خود ندارند(در لین تعادل لین گونه فرض می شود که
هر بازیکن استراتژی های تعادلی بقیه بازیکنان را می داند؛ و با توجه به این ترکیب پیامد
خود را حداکثر می نماید)
صفحه 5:
Prisoner's) معمای زندانی
:(Dilemma
* در شکل متعارف. بازیها را بصورت ماتریسهایی نشان می دهند که عناصر لن دريافتها می
باشد حال فرض م یکنیم دو سارق By A را که با هم مرتکب سرقت شده اند برای
بازجويى به کلانتری آورده و آنها را بطور جداگلنه بازجویی می کنند. اگر هر د وآنها دزدی را
ندء يعنى ( 13ر4 انتظار می رود كه به مدتی زندان محکوم شوند. مطلوبیت دریافتی
برای این مدت زندان را با (۰,۰) نشان می دهیم. اگر هر د وآنها انهام خود را انکار کنند.
یعنی (رقرره, آنها آزاد می شوند. که در اینصورت از کلانتری خارج شده و می توانند
محموله مسروقه را میان خود تقسیم نمایند. با مطلوبیت (۵,۵). اگر یکی از آنها اتهام را انکارد
اما دیگری آن را بپذیرد و به دادستان قول دهد که به عنوان شاهد در دادگاه حضور می یابد.
آنکه اقرار تکرده به مدت طولانی زندانی شده و دیگری آزاد می شود و می تواند محموله
مسروقه را به تنهايى در اختيار بكيرد. ماتريس درياقت بصورت ذيل خواهد بوده
صفحه 6:
Prisoner's) معمای زندانی
:(Dilemma
* بازی فوق دارای Ap) I Ay By) G2: Jol بر یلو وللبر ,8 تفوق دارد)» گرچه
(ثررش بر ن ارجحیت دارد. حتی اگر ارتباطات قبل از بازی بین آنها باشد. ممکن است
بدان وفادار نباشند
صفحه 7:
* بازيها را به دو نوع مى توان تقسیم کرد:
* الف- بازيهاى بدون همكارى
* ب- بازيهاى با همكارى
* در یک بازی بدون همکاری, هر بازیکن استراتژی خود را بدون مشورت با بازيكنان ديكر انتخاب
می کند. در این گونه بازیها هیچکدام از بازیکنان اطلاع اولیه ای از استراتژیهای سایرین (حریفان
خود) ندارد. در حالیکه در بازیهای با همکاری. بازیکنان در خصوص تصمیم گیری درباره
استراتژیها و دریافتها با یکدیگر همکاری می کنند. در زندگی واقعی موارد زیادی است که اگر
بازیکنان با هم همکاری ننمایند و درباره استراتژیهای خود موافقت نکنند ضرر می بینند. برای
مثال اگر یک اتحادیه کارگری تفاضای حقوق بالایی برای اعضاء خود بنملید و مدیریت از افزایش
حقوق به هر قیمتی اجتناب ورزد. هم کارگران و هم مدیریت هر دو در اثر طولانی شدن اعتصاب
متضرر می شوند, لذا عاقلانه تر است که از طریق مذاکره به توافق برسند.
صفحه 8:
بازی با آگاه ی کامل - بدو نآگاه ی کامل:
* اطلاعات کامل در یک بازی متوللی به معنی آنست که هر یک از بازیکنان هرگاه تصمیمی
بگیرد. بر همه حرکتهای قبلی که توسط سایر بازیکنان انجام شده است وقوف کامل دارد.
برای مثال شطرنج یک بازی متوللی با اطلاعات کامل است. چرا که در هر مرحله از فرآیند
تصمیم گیری. هر بازیکن از همه حرکتهای قبلی که خود و رقیبش انجام داده اند اطلاع دارد
* بازی های با آگاهی کامل, بازی هلیی هستند که تمام بازیکنان می توانند در هر لحظه تمام
ت رکیب بازی را در مقابل خود مشاهده کنند. مانند شطرنج. از سوی دیگر در بازی های بدون
آگاهی کامل ظاهر و ترکیب کل بازی برای بازیکنان پوشیده است. مانند بازی هایی که با
ورق انجام می شود.
صفحه 9:
بازی با آگاه ی کامل - بدو نآگاهی
کامل(ادام ه)؛
* نوع خاصی از این بازیهء بازی با اطلاعات ناقص است در اين بازى يك طرف اطلاعات
بیشتری نسبت به بازیکن حریف دارد. به این نوع بازی " بازی اطلاعات ناقص" میگویند.
اصل عمومی لین است که اگر بازیکن اطلاعات اضلفی دارد. لزوماً نبلید هميشه و همه ی آن
رابه حریف بروز دهد بلکه بلید در بروز اطلاعات به صورت گزینشی عمل کند؛ یعنی باید به
بیان اطلاعاتی بپردازد که منجر به بروز رفتاری در حریف شود و نتیجه لن به نفع او باشد.
این نوع اطلاعات را اطلاعات خوب مییگویند.بالعکس فردی که اطلاعات کم دارد ممکن است
شرایطی را ایجاد کند که طرف مقلبل اطلاعات صحیح را به او منتقل کند, لین عمل غربال
کردن نام دارد.
صفحه 10:
است راتژی م رکب 516121607 002217+؛
* در یک بازی استراتزی بهینه یک بازیکن ممکن است خلص یا مرکب باشد. اگر استراتژی
بهینه تنها یکی از استراتژیهای موجود باشد. به آن استراتژی بهینه خللس می گویند. اما اگر
استرانژی بهینه مستلزم لن باشد که بازیکن تعدادی یا همه استراتژیهای موجود را با
احتمالاتی که به هر یک منسوب است استفاده کند, به آن استراتژی م رکب می گویند.
"استراتژی مختلط (5۳۵66077 ۷33۲60 ): استراتی به صورت تصادفی انتخاب میگردد.
"ستراتژی all 5۳3160 ۳۳6): یک استراتژی منحصر بفرد انتخاب میگردد.
صفحه 11:
تعادل استکلب رگ ( Stackelberg
s(equilibrium
* أسارزتزين:وساتةقزيق بازئ: بويا تؤسظ"استكليزف ذر .سال 15176:معزقى قتدادر
اين بازى يكى از بازيكنان داراى قدرت بيشترى است و به عنوان رهبر در بازی
انتخاب می شود پس شروع کننده بازی است.طرف دوم ,پیرو با توجه به استراتژی
رهبر بهترین استراتژی و بازی خود را انتخاب می کند .سپس رهبر بازی با توجه به
عکس العمل پیرو استراتژی بعدی خود را انتخاب می کند و این بازی به همین
ترتیب ادامه می یابد.(در واقع نوعی بازی نوبتی است)
صفحه 12:
موارد لازم برای Game Theory:
* فرض Lol در بازيها cul Gal gies 4 Fationality.c.| rationality
که بازیکنان از تمام قوانین و عکس العملهای طرف مقلبل آگاه هستند و دارای هر
نوع توانایی در استدلال هستند و به صورت عقلانی در هر موردی عمل می کنند
(عقلانیت محض) با لین فرض در27) لازم است که بازیکنان و واکنش های آنها و
مقدار سود و زیان هر واکنش به صورت دقیق تعیین شود
صفحه 13:
موارد لازم برای :59
* برای یک تحلیل دقیق از سیستم توسط (51لازم است كه به صورت دقیق عوامل
تاثیر گذار و روابط بین آنها را (Casual relation) تعیین کنیم .
صفحه 14:
SD:; Game Theory مقایسه
Game Theory موضوع لت
Dynamic
Wed Gort Melee ,
۲ نوع سيستم يويا و بيوسته گسسته و ایستا
3 پویایی دارد در بعضی از بازیها
4 بازخور حلقه هاى بازكشتى مقابله به مثل,عكس العمل
0612 تابع seen 5
صفحه 15:
SD:; Game Theory مقایسه
Game PK)
Dynamic
نمايش خروجی کل تغييرات ee سیستم در
7 فرض اصلی - مسج
9 دحت حي کمی و كيقي كمي
10 نوع تصمیم گیرنده Ou Grete
صفحه 16:
* دریک نتیجه گیری کلی می توان گفت (5 به بررسی سیستم های پیوسته و پو
یا می پردازد در صورتیکه 287[26) سیستم های گسسته و ایستا را بررسی می
کند ولی هردو تقریبا دارای یک هدف و یک کاربرد هستند و هرکدام دارای نقاط
وت رو ضعفت»مخصومزوبب. خود؛ هستنله پسن یه کاربردین هرد و آنها: ایک سبستم:
کمک می کند تا بتوانیم رفتار سیستم را دقيق قر و بهتر بررسی کنیم وسیاست
هاى لازم رأ اتخاذ کنیم.
صفحه 17:
Dong-Hwan
Kima* and Doa
رسیدن به تعادل Hoon
Kimb(1997)
تاخير در اطلاعات Mix-Strategy دولت و توليد کنندگان CAL Ling-
مواد شیمیایی ru,Wang Hong-
wei,Zeng
Wei(2008)
تاخیر در اطلاعات همکارانه تولید کننده و خریداز JJ
و تصميم كيرى در بلند. Sanchez,J.Barq
عدت )2008( uim
تخیر در اطلاعات رقابتی تولید کننده هاو خریدار IJ
و تصميم أكيرى در بلند Sanchez,J.Barq
مدت و بررسی روند uim,E.Centeno(
تغييرات (2010
صفحه 18:
ن تمام نقاط تعادل با Mohammad
هوض كردن مقادير أوليه Rasoli(2009)
مشکل بودن حل دوباره مهمکارانه از نوع دیفرانسیلی. فروشنده و خرده فروش Bowon
هنگام تغییر سیاستهای Kim,Chulsoon
قیمت گذاری Park(2010)
صفحه 19:
A system dynamics model for a mixed-strategy game
between police and driver
Dong-Hwan Kim! and Doa Hoon Kim?
Abstract
Game thearlsts have recommended many reasonable strategies in policy problems, using, in
general, the concept of equilibrium strategy for analyzing the <ynamle consequences of |
Svallable policy options. One of the best known recommendations is that of George Tsebelis,
Which contends thar increasing penalties is not a viable policy tool for decreasing the law.
Violation tendencies of drivers. This is because the interactions between police and driver
can best be represented as a mixed strategy in which the players choose their alternative
actions based upon a probability, but the probability of driver’s law violation cannot be
Aecreased by increasing the penalty. Our system dynamics model for a mixed-strategy game
shows that it takes a very long time for a game-theoretic equilibrium to appear. Therefore,
game players cannor, and shotild not, clepend on the equilibrium for choosing their actions
Furthermore, our mixed-game model shows that an increase in penalty can induce
compliance from the people, contradictory to the game-theoretic solution, but consistent
with veak-world behaviors. © 1997 by John Wiley a Sons, Lids Syst, Dyn. Res. 13, 35-52,
190
(No, of Figures: 13. No, of Tables: 4 No, of Refs: 12)
صفحه 20:
* تلوری بازیها استراتژی های قلبل قبیلی را در بسیاری از مسائل مربوط به پلیس ارائه داده
است)۱۹۸۹). 15616115 260106) توسط تئوری بازیها اثبات کرده است که افزایش
جریمه ها راه حل مناسبی برای کاهش تخلفات توسط راند كان نيستدر لين مقاله يازى
پلیس و رانندگان را به صورت یک بازی با است نظر گرفته است که
رانندگان و يليس استراتژی خود را با احتمالات متفاوت alee عر os وتوسط SD
نشان ميدهيم كه وقتى جريمه ها افزليش مى يابند مدت زيادى طول مى كشد تا رانندكان
از میزان تخلفات خود بکاهندو در واقع نقطه تعادل نش به دست آمده از بازيها غير عملى
است.
صفحه 21:
* بازی از نوع استراتژی مرکب است و به صورت زیر ا
* شما در حال رانندگی هستید و برای رسیدن به مقصد عجله دارید دو حللت وجود دارد:یا
پلیس در آن نزدیکی هاست یا در آن نزدیکی نیست و شما هم یا میتوانید خلاف کنی
بروید یا دیر به مقصد بررسید.پس در کل ۴ حالت وجود دارد:
(8تند بروید وپلیس در نزدیکی باشد جریمه شوید.
(تند بروید وپلیس در نزدیکی نباشد جریمه نشوید.
(0پلیس در نزدیکی باشد و تند نرويد و دير به مقصد برسيد.
(0يليس در نزديكى نباشد و تند نرويد و دير به مقصد برسيد.
pt = (d2— €2)/(a2— b2 + d2— c2)
(b1 — d1)/(b1 — d1 + cl—al)
صفحه 22:
استفاده از ([5
Fig 1. STELLA باس
diagrarn for a mixed-
strategy game 2 موم
ری ربمم مس
eb
potteren tang
سس 000
roe
fea pol
Om satin sme SP 9
rome 4 مس
00 we
9208 don ie -
spent doy // olan cnt
ی مير
7 8
alarm مها
صفحه 23:
ننایج به دست آمده از ([5
Tsebelis 0 مقاله خود ثابتکرد که لیزدو ری یکتعدلمییسند وليلینکه
جكونه به ليزتعادا را ب 2 + لینموضوع تسوجه SH
د كه لكر اييكنا ندر يسيدنبه لين وسانهجار وعد ند ميكر لين اذكرا
ادلمه نمىدهندش كإيير نحوه يفتر بانيكنازرا در لين انِئ: شازنمىدهد ولضح لستكه
نحوه يسيدزيه تعادز J سوسانییستو ب يكن یر غبر منتظره عملمیک ن:
همچنین۲ سالپ رلی + لیرتعادل نمانلاز o ياوولقعمع ملاب معنى
لسعم يقد یش یمد ها بسه سوت کیان یتمه سیستم بسه طوز
عجیبیت بر يفتار و شا il, ندكانيه ط ور ۳ بیر صی, 3 = تم از
کل خلیج میشنود:
صفحه 24:
4: prob p 2: prob v
4 1.00
صفحه 25:
قاثي ر افزايش جريمه در سيستم:
مج بو
1: prep 2 prob v
dpvp (driver payoff for violation with patrol)
صفحه 26:
بررسی موردی:
* قدمهای لازم در بررسی مسئله:
گام ۱ )تعریف مسئله
گام ۲)بررسی مسئله به صورت بازی
گام۴)یافتن شکاف ها در بررسی مسئلهبه صورت بازی و رفع آن
SD bug
گام ۴)ترسیم نمودار علی
گام ۵)نمودار جریان و اجرا ی آن در نرم افزار
صفحه 27:
گام|)تعریف مسئلهء
Vertical co-op advertising |
* یک تولید کننده و یک خرده فروش را در نظر بگیرید که برای دسترسی به فروش
بالاتر از تبلیفات استفاده می کنند ,خرده فروش در سطح محلی تبلیغ م ی کند و
تولید کننده در سطح ملیپس مقدار سرمایه گذار ی آنها برای تبلیغات متفاوت است
. تولید کننده تعهد می کند که بر اساس فروش خرده فروش درصدی ازهزینه
ات خرده فروش را بپردازد .
صفحه 28:
wy (Tl مسله به صورت تئوری بازی هاء
* مسئله را به صورت بازی Stackelberg در نظر می گیریم که در ن تولید کننده
شروع کننده بازی است تولید کنده بر اساس سود خود و سود خرده فروش تصمیم می گیرد
که چه درصدی از هزینه را برای تبلیغات بپردازدهسپس خرده فروش بر اساس لین درصدد
تصمیم می گیرد که هزینه کل تبلیغات محلی چقدر باشد.و بهترین هزینه را که صود خود را
ماگزیمج کند انتخاب م ی کند.
صفحه 29:
گام۳)شکاف ها
()در این مسعله توجه به تغییرات جامعه تشده است و بازی در شرایط کاملاً ایستا دز نظر
گرفته شده (تمریف تابع جدولی برای متفییر جامعه)
۲)با توجه به اينکه مسئله ا ایا در نظ گرفته پس قیمت ها ثابت است به تورم وبلا رفتن
قیمت ماتوجه تشبه سجن (تمریف gol جدولی )
۳)فرض بر این است که تبلیفات سریعا بر فروش تاثیر می گذارد و تاخیر را در نظر نگرفته.(تابع
تاخیر)
صفحه 30:
گام ۴ )نمودار علی
+ e
RNS Sul gh Sg Ns oly a
درآمد تولید کننده
+
eas Te وی 2
های ملی a
هزینه یت ۳ |
۱ élay
هزینه های دلب محلی | نوع جامعه ۱
| | +
/ سود “—payd gop aT» ised gi?
wx
هزينه هاى خرده فروش الب
قيمت خرده فروشى
عم
as
هزینه های نگهداری
صفحه 31:
کام۵) نمودار جریان و اجرا یآن در نرم افزار
مراجعه به نرم افزار