سایرسایر

SYSTEM DYNAMIC and GAME THEORY

31 صفحه
3778 بازدید
24 اسفند 1396

برچسب‌ها

صفحه 1:
SYSTEM DYNAMIC 4 GAME THEORY هدیه پولادخان ۰ ۸۹۶۷۳۰۷۶ ماندانا حاجی حسینی ۸۹۶۷۳۱۰۲ استاد راهنما: جناب آقای دکتر شهانقی

صفحه 2:
فهرست: ۱)مروری بر تلوری بازیها و بازیهای استفاده شده در مقالات مقایسه پسویایی‌هایسیستم با تسئوویب ازیها و عللت رکیبلینهتدها(2 ")بررسي مقالات نمونه کار لنجام شده (4

صفحه 3:
* در یک بازی با گروهی از بازیکن ها سر وکار داریم که هر یک کوشش دارند دریافت ‎Pay-ofh‏ +2 ,| به حداکثر برسانند. لذا هر بازیکن در هنگام تصمیم گیری برای حرکت بهینه خویش باید کلیه واکنش های ممکن بازیکنان دیگر را نسبت به حرکت خود در نظر گیرد. وی حرکات بازیکنان دیگر را با قطعیت نمی داند. اما باید درباره حرکت خویش با نوعی توجیه عقلانی تصمیم گیری کند(7] 01061 78). لذا جستجو برای تصمیم عقلانی نوعی تصمیم گیری در حالت عدم قطعیت به شمار م ی آید. * برای هر بازی سه امر ضروری است: الف- بازیکنان ب- استراتژی های بازیکنان که تحت قواعد بازی مجاز ج- مطلوبيتها يا دريافتها

صفحه 4:
(Nash Equilibrium): yi folds * تعادل( 0۷0110100170): در تعادل هر بازیکن ن استراتژی را بکار می‌گیرد که بهترین پاسخ به استراتژی‌های انتخابی سایر بازیکنان باشد. در تعادل لزوماً همه چیز برای بازیکنان در بهترین حللت نیست. به عبارت دیگر در تعادل لزوما بازیکنان به بیشترین پیامد ‎dg‏ مستت :ويا تم یکمعید * یک نفطه تعادل نش است اگر هر بازیکن بهترین پاسخ خودش را پیدا کند.یعنی هیچ کدام از بازیکنان تمایلی به تغییر استراتژی خود ندارند(در لین تعادل لین گونه فرض می شود که هر بازیکن استراتژی های تعادلی بقیه بازیکنان را می داند؛ و با توجه به این ترکیب پیامد خود را حداکثر می نماید)

صفحه 5:
Prisoner's) ‏معمای زندانی‎ :(Dilemma * در شکل متعارف. بازیها را بصورت ماتریسهایی نشان می دهند که عناصر لن دريافتها می باشد حال فرض م یکنیم دو سارق ‎By A‏ را که با هم مرتکب سرقت شده اند برای بازجويى به کلانتری آورده و آنها را بطور جداگلنه بازجویی می کنند. اگر هر د وآنها دزدی را ندء يعنى ( 13ر4 انتظار می رود كه به مدتی زندان محکوم شوند. مطلوبیت دریافتی برای این مدت زندان را با (۰,۰) نشان می دهیم. اگر هر د وآنها انهام خود را انکار کنند. یعنی (رقرره, آنها آزاد می شوند. که در اینصورت از کلانتری خارج شده و می توانند محموله مسروقه را میان خود تقسیم نمایند. با مطلوبیت (۵,۵). اگر یکی از آنها اتهام را انکارد اما دیگری آن را بپذیرد و به دادستان قول دهد که به عنوان شاهد در دادگاه حضور می یابد. آنکه اقرار تکرده به مدت طولانی زندانی شده و دیگری آزاد می شود و می تواند محموله مسروقه را به تنهايى در اختيار بكيرد. ماتريس درياقت بصورت ذيل خواهد بوده

صفحه 6:
Prisoner's) ‏معمای زندانی‎ :(Dilemma * بازی فوق دارای ‎Ap) I Ay By) G2: Jol‏ بر یلو وللبر ,8 تفوق دارد)» گرچه (ثررش بر ن ارجحیت دارد. حتی اگر ارتباطات قبل از بازی بین آنها باشد. ممکن است بدان وفادار نباشند

صفحه 7:
* بازيها را به دو نوع مى توان تقسیم کرد: * الف- بازيهاى بدون همكارى * ب- بازيهاى با همكارى * در یک بازی بدون همکاری, هر بازیکن استراتژی خود را بدون مشورت با بازيكنان ديكر انتخاب می کند. در این گونه بازیها هیچکدام از بازیکنان اطلاع اولیه ای از استراتژیهای سایرین (حریفان خود) ندارد. در حالیکه در بازیهای با همکاری. بازیکنان در خصوص تصمیم گیری درباره استراتژیها و دریافتها با یکدیگر همکاری می کنند. در زندگی واقعی موارد زیادی است که اگر بازیکنان با هم همکاری ننمایند و درباره استراتژیهای خود موافقت نکنند ضرر می بینند. برای مثال اگر یک اتحادیه کارگری تفاضای حقوق بالایی برای اعضاء خود بنملید و مدیریت از افزایش حقوق به هر قیمتی اجتناب ورزد. هم کارگران و هم مدیریت هر دو در اثر طولانی شدن اعتصاب متضرر می شوند, لذا عاقلانه تر است که از طریق مذاکره به توافق برسند.

صفحه 8:
بازی با آگاه ی کامل - بدو نآگاه ی کامل: * اطلاعات کامل در یک بازی متوللی به معنی آنست که هر یک از بازیکنان هرگاه تصمیمی بگیرد. بر همه حرکتهای قبلی که توسط سایر بازیکنان انجام شده است وقوف کامل دارد. برای مثال شطرنج یک بازی متوللی با اطلاعات کامل است. چرا که در هر مرحله از فرآیند تصمیم گیری. هر بازیکن از همه حرکتهای قبلی که خود و رقیبش انجام داده اند اطلاع دارد * بازی های با آگاهی کامل, بازی هلیی هستند که تمام بازیکنان می توانند در هر لحظه تمام ت رکیب بازی را در مقابل خود مشاهده کنند. مانند شطرنج. از سوی دیگر در بازی های بدون آگاهی کامل ظاهر و ترکیب کل بازی برای بازیکنان پوشیده است. مانند بازی هایی که با ورق انجام می شود.

صفحه 9:
بازی با آگاه ی کامل - بدو نآگاهی کامل(ادام ه)؛ * نوع خاصی از این بازیهء بازی با اطلاعات ناقص است در اين بازى يك طرف اطلاعات بیشتری نسبت به بازیکن حریف دارد. به این نوع بازی " بازی اطلاعات ناقص" میگویند. اصل عمومی لین است که اگر بازیکن اطلاعات اضلفی دارد. لزوماً نبلید هميشه و همه ی آن رابه حریف بروز دهد بلکه بلید در بروز اطلاعات به صورت گزینشی عمل کند؛ یعنی باید به بیان اطلاعاتی بپردازد که منجر به بروز رفتاری در حریف شود و نتیجه لن به نفع او باشد. این نوع اطلاعات را اطلاعات خوب مییگویند.بالعکس فردی که اطلاعات کم دارد ممکن است شرایطی را ایجاد کند که طرف مقلبل اطلاعات صحیح را به او منتقل کند, لین عمل غربال کردن نام دارد.

صفحه 10:
است راتژی م رکب 516121607 002217+؛ * در یک بازی استراتزی بهینه یک بازیکن ممکن است خلص یا مرکب باشد. اگر استراتژی بهینه تنها یکی از استراتژیهای موجود باشد. به آن استراتژی بهینه خللس می گویند. اما اگر استرانژی بهینه مستلزم لن باشد که بازیکن تعدادی یا همه استراتژیهای موجود را با احتمالاتی که به هر یک منسوب است استفاده کند, به آن استراتژی م رکب می گویند. "استراتژی مختلط (5۳۵66077 ۷33۲60 ): استراتی به صورت تصادفی انتخاب میگردد. "ستراتژی ‎all‏ 5۳3160 ۳۳6): یک استراتژی منحصر بفرد انتخاب میگردد.

صفحه 11:
تعادل استکلب رگ ( ‎Stackelberg‏ ‎s(equilibrium‏ * أسارزتزين:وساتةقزيق بازئ: بويا تؤسظ"استكليزف ذر .سال 15176:معزقى قتدادر اين بازى يكى از بازيكنان داراى قدرت بيشترى است و به عنوان رهبر در بازی انتخاب می شود پس شروع کننده بازی است.طرف دوم ,پیرو با توجه به استراتژی رهبر بهترین استراتژی و بازی خود را انتخاب می کند .سپس رهبر بازی با توجه به عکس العمل پیرو استراتژی بعدی خود را انتخاب می کند و این بازی به همین ترتیب ادامه می یابد.(در واقع نوعی بازی نوبتی است)

صفحه 12:
موارد لازم برای ‎Game Theory:‏ * فرض ‎Lol‏ در بازيها ‎cul Gal gies 4 Fationality.c.| rationality‏ که بازیکنان از تمام قوانین و عکس العملهای طرف مقلبل آگاه هستند و دارای هر نوع توانایی در استدلال هستند و به صورت عقلانی در هر موردی عمل می کنند (عقلانیت محض) با لین فرض در27) لازم است که بازیکنان و واکنش های آنها و مقدار سود و زیان هر واکنش به صورت دقیق تعیین شود

صفحه 13:
موارد لازم برای :59 * برای یک تحلیل دقیق از سیستم توسط (51لازم است كه به صورت دقیق عوامل تاثیر گذار و روابط بین آنها را ‎(Casual relation)‏ تعیین کنیم .

صفحه 14:
SD:; Game Theory ‏مقایسه‎ Game Theory ‏موضوع لت‎ Dynamic Wed Gort Melee , ۲ نوع سيستم يويا و بيوسته گسسته و ایستا 3 پویایی دارد در بعضی از بازیها 4 بازخور حلقه هاى بازكشتى مقابله به مثل,عكس العمل 0612 ‏تابع‎ seen 5

صفحه 15:
SD:; Game Theory ‏مقایسه‎ Game PK) Dynamic نمايش خروجی کل تغييرات ‎ee‏ سیستم در 7 فرض اصلی - مسج 9 دحت حي کمی و كيقي كمي 10 نوع تصمیم گیرنده ‎Ou Grete‏

صفحه 16:
* دریک نتیجه گیری کلی می توان گفت (5 به بررسی سیستم های پیوسته و پو یا می پردازد در صورتیکه 287[26) سیستم های گسسته و ایستا را بررسی می کند ولی هردو تقریبا دارای یک هدف و یک کاربرد هستند و هرکدام دارای نقاط وت رو ضعفت»مخصومزوبب. خود؛ هستنله پسن یه کاربردین هرد و آنها: ایک سبستم: کمک می کند تا بتوانیم رفتار سیستم را دقيق قر و بهتر بررسی کنیم وسیاست هاى لازم رأ اتخاذ کنیم.

صفحه 17:
Dong-Hwan Kima* and Doa رسیدن به تعادل ‎Hoon‏ ‎Kimb(1997)‏ ‏تاخير در اطلاعات ‎ Mix-Strategy‏ دولت و توليد کنندگان ‎CAL Ling-‏ مواد شیمیایی ‎ru,Wang Hong-‏ ‎wei,Zeng‏ ‎Wei(2008)‏ ‏تاخیر در اطلاعات همکارانه تولید کننده و خریداز ‎JJ‏ ‏و تصميم كيرى در بلند. ‎Sanchez,J.Barq‏ ‏عدت )2008( ‎uim‏ ‏تخیر در اطلاعات رقابتی تولید کننده هاو خریدار ‎IJ‏ ‏و تصميم أكيرى در بلند ‎Sanchez,J.Barq‏ ‏مدت و بررسی روند ‎uim,E.Centeno(‏ تغييرات (2010

صفحه 18:
ن تمام نقاط تعادل با ‎Mohammad‏ هوض كردن مقادير أوليه ‎Rasoli(2009)‏ ‏مشکل بودن حل دوباره مهمکارانه از نوع دیفرانسیلی. فروشنده و خرده فروش ‎Bowon‏ ‏هنگام تغییر سیاستهای ‎Kim,Chulsoon‏ قیمت گذاری ‎Park(2010)‏

صفحه 19:
A system dynamics model for a mixed-strategy game between police and driver Dong-Hwan Kim! and Doa Hoon Kim? Abstract Game thearlsts have recommended many reasonable strategies in policy problems, using, in general, the concept of equilibrium strategy for analyzing the <ynamle consequences of | Svallable policy options. One of the best known recommendations is that of George Tsebelis, Which contends thar increasing penalties is not a viable policy tool for decreasing the law. Violation tendencies of drivers. This is because the interactions between police and driver can best be represented as a mixed strategy in which the players choose their alternative actions based upon a probability, but the probability of driver’s law violation cannot be Aecreased by increasing the penalty. Our system dynamics model for a mixed-strategy game shows that it takes a very long time for a game-theoretic equilibrium to appear. Therefore, game players cannor, and shotild not, clepend on the equilibrium for choosing their actions Furthermore, our mixed-game model shows that an increase in penalty can induce compliance from the people, contradictory to the game-theoretic solution, but consistent with veak-world behaviors. © 1997 by John Wiley a Sons, Lids Syst, Dyn. Res. 13, 35-52, 190 (No, of Figures: 13. No, of Tables: 4 No, of Refs: 12)

صفحه 20:
* تلوری بازیها استراتژی های قلبل قبیلی را در بسیاری از مسائل مربوط به پلیس ارائه داده است)۱۹۸۹). 15616115 260106) توسط تئوری بازیها اثبات کرده است که افزایش جریمه ها راه حل مناسبی برای کاهش تخلفات توسط راند كان نيستدر لين مقاله يازى پلیس و رانندگان را به صورت یک بازی با است نظر گرفته است که رانندگان و يليس استراتژی خود را با احتمالات متفاوت ‎alee‏ عر ‎os‏ وتوسط ‎SD‏ ‏نشان ميدهيم كه وقتى جريمه ها افزليش مى يابند مدت زيادى طول مى كشد تا رانندكان از میزان تخلفات خود بکاهندو در واقع نقطه تعادل نش به دست آمده از بازيها غير عملى است.

صفحه 21:
* بازی از نوع استراتژی مرکب است و به صورت زیر ا * شما در حال رانندگی هستید و برای رسیدن به مقصد عجله دارید دو حللت وجود دارد:یا پلیس در آن نزدیکی هاست یا در آن نزدیکی نیست و شما هم یا میتوانید خلاف کنی بروید یا دیر به مقصد بررسید.پس در کل ۴ حالت وجود دارد: (8تند بروید وپلیس در نزدیکی باشد جریمه شوید. (تند بروید وپلیس در نزدیکی نباشد جریمه نشوید. (0پلیس در نزدیکی باشد و تند نرويد و دير به مقصد برسيد. (0يليس در نزديكى نباشد و تند نرويد و دير به مقصد برسيد. ‎pt = (d2— €2)/(a2— b2 + d2— c2)‏ (b1 — d1)/(b1 — d1 + cl—al)

صفحه 22:
استفاده از ([5 Fig 1. STELLA ‏باس‎ ‎diagrarn for a mixed- strategy game 2 ‏موم‎ ‏ری ربمم مس‎ eb potteren tang ‏سس‎ 000 roe fea pol Om satin sme SP 9 rome 4 ‏مس‎ ‎00 we 9208 don ie - spent doy // olan cnt ‏ی مير‎ 7 8 alarm ‏مها‎

صفحه 23:
ننایج به دست آمده از ([5 ‎Tsebelis‏ 0 مقاله خود ثابتکرد که لیزدو ری یکتعدل‌می‌یسند ولي‌لینکه جكونه به ليزتعادا را ب 2 + لین‌موضوع تسوجه ‎SH‏ ‏د كه لكر اييكنا ندر يسيدنبه لين وسانهجار وعد ند ميكر لين اذكرا ادلمه نمىدهندش كإيير نحوه يفتر بانيكنازرا در لين انِئ: شازنمىدهد ولضح لستكه نحوه يسيدزيه تعادز ‎J‏ سوسانییستو ب يكن یر غبر منتظره عملمیک ن: همچنین۲ سالپ رلی + لیرتعادل نمانلاز ‎o‏ ياوولقعمع ملاب معنى ‏لسعم يقد یش یمد ها بسه سوت کیان یتمه سیستم بسه طوز عجیبیت بر يفتار و شا ‎il,‏ ندكانيه ط ور ۳ بیر صی, 3 = تم از کل خلیج می‌شنود: ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 24:
4: prob p 2: prob v 4 1.00

صفحه 25:
قاثي ر افزايش جريمه در سيستم: مج بو 1: prep 2 prob v dpvp (driver payoff for violation with patrol)

صفحه 26:
بررسی موردی: * قدمهای لازم در بررسی مسئله: گام ۱ )تعریف مسئله گام ۲)بررسی مسئله به صورت بازی گام۴)یافتن شکاف ها در بررسی مسئله‌به صورت بازی و رفع آن ‎SD bug‏ گام ۴)ترسیم نمودار علی گام ۵)نمودار جریان و اجرا ی آن در نرم افزار

صفحه 27:
گام|)تعریف مسئلهء ‎Vertical co-op advertising |‏ * یک تولید کننده و یک خرده فروش را در نظر بگیرید که برای دسترسی به فروش بالاتر از تبلیفات استفاده می کنند ,خرده فروش در سطح محلی تبلیغ م ی کند و تولید کننده در سطح ملی‌پس مقدار سرمایه گذار ی آنها برای تبلیغات متفاوت است . تولید کننده تعهد می کند که بر اساس فروش خرده فروش درصدی ازهزینه ات خرده فروش را بپردازد .

صفحه 28:
‎wy (Tl‏ مسله به صورت تئوری بازی هاء ‎ ‎ ‏* مسئله را به صورت بازی ‎Stackelberg‏ در نظر می گیریم که در ن تولید کننده شروع کننده بازی است تولید کنده بر اساس سود خود و سود خرده فروش تصمیم می گیرد که چه درصدی از هزینه را برای تبلیغات بپردازدهسپس خرده فروش بر اساس لین درصدد تصمیم می گیرد که هزینه کل تبلیغات محلی چقدر باشد.و بهترین هزینه را که صود خود را ماگزیمج کند انتخاب م ی کند. ‎ ‎ ‎

صفحه 29:
گام۳)شکاف ها ()در این مسعله توجه به تغییرات جامعه تشده است و بازی در شرایط کاملاً ایستا دز نظر گرفته شده (تمریف تابع جدولی برای متفییر جامعه) ۲)با توجه به اينکه مسئله ا ایا در نظ ‏ گرفته پس قیمت ها ثابت است به تورم وبلا رفتن قیمت ماتوجه تشبه سجن (تمریف ‎gol‏ جدولی ) ۳)فرض بر این است که تبلیفات سریعا بر فروش تاثیر می گذارد و تاخیر را در نظر نگرفته.(تابع تاخیر)

صفحه 30:
گام ۴ )نمودار علی + e RNS Sul gh Sg Ns oly a ‏درآمد تولید کننده‎ + eas Te ‏وی‎ 2 های ملی ‎a‏ ‏هزینه یت ۳ | ۱ élay هزینه های دلب محلی | نوع جامعه ۱ | | + / سود ‎“—payd gop aT» ised gi?‏ wx ‏هزينه هاى خرده فروش الب‎ ‏قيمت خرده فروشى‎ ‏عم‎ as ‏هزینه های نگهداری‎

صفحه 31:
کام۵) نمودار جریان و اجرا یآن در نرم افزار مراجعه به نرم افزار

34,000 تومان