ریاضیعلوم پایه

مدل انتخاب LOGIT

صفحه 1:

صفحه 2:
Mery دانشگاه صنعتی امیر کبیر (پلي تکنیک تهران) دانشکده مهندسي صنایع مدل انتخاب ‎Logit‏ استاد: دکتر جمال شهرابی ارائه دهنده: اسماعیل مرادی زستان ۱۳۸

صفحه 3:
ال * مقدمه * کاربرد مدل * مدل ابا صفر و یک * مدل ابا چند گزینه ای ‎QDested Loca Js *‏

صفحه 4:

صفحه 5:
a : * برخلاف ساير روشهاى ارائه شده تاكنون براى تحليل همبستكى. روشى كه در اتن فصل معرفى مَى شود خيرخطى امنت. * احتمال انتخاب به خروجىهاى انتخابى كسسته كه متغير (يا متغيرهاى) وابسته را تشکیل می‌دهند. نسبت داده می‌شوند. 1 صفر و یک قرار دارد. نیاز به یک شکل تابع غیرخطی است تا بتوان اطلاعات متغیرهای مستقل پیوسته را به بازه صفر و یک تبدیل کرد. * شکل تابع مورد استفاده برای مدل احتمالی تا حد زیادی بستگی به توزیع مفروض برای خطای شناسایی ناشی از مدل دارد. * مدل ابا دارای تابعی با فرم بسته و سرراست می‌باشد که به سادگی با استفاده از روش‌های حداکثر مشابهت تخمین زده می‌شود.

صفحه 6:

صفحه 7:
مدل‌های انتخاب گسسته چون مدل ایا برای مطالعه انواع مختلف رفتارهای انتخابی به کار رفته اند: * انتخاب محل خريد ** انتخاب محل سکونت * انتخاب شغل انتخاب مسير بين دو مقصد * انتخاب مارک جنس در دو زمینه انتخاب مسیر بین دو مقصد و مارک جنس. مقدار قابل توجهی تحقیق و مدل‌سازی انجام شده است که در اسلایدهای بعد به آنها می پردازيم.

صفحه 8:
مواردکاربرد - زد نتخاب مسير گذر * (1966) مورا اجه و102 مدلس ازی‌لنتخابگسسته در ارتباط بسا تسحلیلسیستجای‌حملو نقل؛ تسوسعه فسرآیندهایی‌سرلی‌مدلسانی شکسته نیاز سفر, در سطح تسحلیلیفتار لنتخایسکفنرد. خانوادد یا شرکت * (0906) مه انتخاب گسته متمرکز پر انتخاب صفر و یک چگونگی سفر * (0976) 259: مطااماتی در زمینه لنتخابچگرنگی‌مسیر وفترسه کار بسالستفاده از لطلهاتگردآویی‌شده در سلل۱۹1۸ ولشنگتن نسونه شامل۱۱۳۹ کارگر بسود که لمکان‌لنتخابدو یبا تسعداد بسیشتریاز سه رهش جلبجایی را دلشتند

صفحه 9:
VS Sle qlee دوتراکدراوف‎ * (1969) عاا اجه مطل() : ایلیرلفرادیودند که از لطاهانلسکن شده موردییسرلیکابرلسیون یسکمد لاب چند گز ینهلی‌انتخا ما رک ک لا لستفادد کردند ؛ مدل‌در لنتخابگ روص شرطىئيود یسعنی‌لنها تسنها بسر پسیشوسینیلینکه کلم مارکدر یسک‌خرید صورتگرفته از اینگرود لنتخاب خولهد شد تساکید کردند نها تسوانستندلثرلقیمتو تسبلیغ را در لنتخاب مارک‌تسخمیبزنند و قادر بسه لستفاده از مدل‌بسرلی‌تسخمیر | لاستیسیته قیمقا و اسلاستیسته ۳۳۸ 7۳55 بسرلی‌هردو حاسلقیستسبلیفیو غیر تبلیفی‌شدند

صفحه 10:

صفحه 11:
ال ۳ مدل انتخاب ‎ae bout‏ و یک یک فردخاص را در نظر بگیرید که از یک یر 5906 ‎ae‏ ‏سوپرمارکت که دو مارک متفاوت از یک گروه محصول (مارک‌های 9 و ©) را ارائه می‌کند. خرید می‌کند. قیت معمول ابن مارکد یکسان است اما مارک ) تخفی متناوبی را ارائه می‌دهد و اغلب ۰۱۰ ۸۱۵ ۲۰ و یا حتی ۳۰ سنت ارزانتر از محصول 8 است (که قیمتش ثابت باقی می‌ماند). ‎wre‏ 9 3 * هدف ما ساخت مدلی در سطح فرد برای تعيين احتمال خريد مارك 9) به صورت تابعی از تخفیف ارائه شده توسط مارک 49 5 ‘ We ‘ th می باشد

صفحه 12:
* فرض های مدل: ‎ie‏ ‏اترات تجمعی مطاوییت ناشی از فاکتورهای متعدد غیرمشاهده‌ای) دی به فره ‎SDD‏ ‏تامين شده| (بخشی از تابع مطلوبیت که ما به عنوان مدل‌کننده قادر به فرد گزینه | تعیین آن با توجه به اطلاعات وجود دار موجود خود هستیم) ‎A‏ ‏ار غیر اين صو: تزینه دوم را انتخاب الك به تمام اطلاعات مورد ع +برح() تابع مطلوییت فد را

صفحه 13:
بخش قطعى #رارا به صورت تركيب خطی از متفیرهای مستقل مدل می‌کنیم. * از انجا که ما مقدار ‏ زا مشاهده نمی‌کنيم. #ا بگوییم که فرد کدام گزینه را انتخاب خوا * می‌دانیم که فرد گزینه ۱ را در برابر گزینه ‎Xp Brey‏ <رع 6 ‎XB‏ > )>( -بع) ی ‏* ما مدا ( راشي دلتهمبا )وجوه اكر تيع توزيع مربوط به متغير تصادلى را بدايم حداقل مىتوايم بكوبيم كد احتمال برقرارى تامساوى ‏تا چه حد است.

صفحه 14:
* فرض کنید (,,ع -,,ع) نشان دهنده تابع چگالی احتمال باشد در این صورت خواهيم داشت: ۲ كن * مقدار اين احتمال به صورت كرافيكى عبارت است از: ‎Fle e- &4)‏ ار

صفحه 15:
مدل انتخاب ابا صفر و یک * اگر فرض کنیم كه )6.0 ‎Ere”‏ دارای تابع چگالی توزیع نرمال باشد. مدل احتمالی حاصل به عنوان مدل هس شناخته می‌شود. 9 از آنجا که توزیع نرمال تجمعی دارای شکل بسته نمی‌باشد. شکل تابع بسته‌ای برای احتمال انتخاب وجود ندارد. با اين که این مساله غیر قابل حل نیست: مواقعی وجود دارد که بهتر است احتمال انتخاب را به صورت تابعی از متغیرهای مستقل نمایش داد. * به عنوان یک گزینه دیگر, اگر (2:4 -6©راى تابع توزیع زیر باشد. مدل حاصل #با میباشد. [(ر6 6 ‎expt‏ = ليع - ,۶ )]),¢ -6) ۵0۲ +)

صفحه 16:
ال ۳ مدل انتخاب ابا صفر و یک * فایده حقیقی استفاده از توزیع ایا این است که منجر به شکل بسته‌ای برای توصیف احتمال می‌گردد. زیرا: ۱ “\rexpt (x, x) I> ‏ا 96,8 - به‎ exp, 6)+exp&, 6) ‎Sate SI‏ ( ,7006© به عنوان جذابيت كزينه ‎١‏ در نظر بكيريم؛ احتمال انتخاب كزيته ۱ با درصد مشارکت گزینه یک در مجموع جذابیت گزینه یک و دو تعیین می‌گردد. ‎_ pede exp (e,,- ey] A 7 ‎E> Ey) ‎

صفحه 17:
مدل انتخاب ابا صفر و یک مقادیر پارامترهای تابع مطلوبیت مدل الا به سادگی با استفاده از حداکثر مشابهت تخمین زده می‌شوند. در حداکثر مشابهت هدف ما این است که پارامترهای مدل (بردار ضرایب ‏ 6 را به نحوی انتخاب کنیم که احتمال اشتراک يا شباهت مشاهده خروجی‌های مدل را حداکثر کنیم. اگر فرض کنیم که مشاهدات از یکدیگر مستقل هستند. این شباهت با ضرب احتمالات کلیه فرصت‌های انتخاب به دست می‌آید. راه ساده‌ایی برای نوشتن این رابطه به صورت زير می باشد. 7,<1, Pi 0 (۲ 2 * از روش‌های عددی بهینه‌سازی. برای انتخاب مقادیری از بتا که عبارت بالا را حداکثر می‌کنند. استفاده می‌شود.

صفحه 18:
مدل انتخاب ‎ae bout‏ و یک دوش حدافتر بت بای ما بل ‎Va, =A, + BD,‏ ورت جح .جرلا B w we ws Wwe Ww ‎aren‏ العام ۳ ‎neu wee‏ ول ‎ae arrive mare rear erwin 330 3 11 sarin ۳ ۳/۳ ‎3 ‏العم ۳ ۳ ااا‎ nevus ‎ovr oar ۳ vein ‏ال‎ vie ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 19:
مدل انتخاب ابر صفر و یک * خصوصیات مدل بسا ۲ معنی‌داری مدل: مقادیر حداکثر مشابهت برای دو مدل کامل و محدود شده (پزخی پارامتزها بزابر صفز فرار:داده شده اند) را پذست آورده ویا لیا ‎TT‏ ‏(بلآ -بلل)۲- نمایش ميدهیم. آماره آزمون برایر است با كه یک آماره کای با درچه آزادی برابر با تعداد پارامترهایی که در مدل محدود شده برابر با صفر قرار داده شده‌اند؛ می باشد. ۲ 3 نيكويى برازش م می توانیم به معیارهای ‎BIO‏ و(96) و شاخص اشاره کنیم 7

صفحه 20:
me re eg per em * کتاب با پست برای معرفی کتابی. به ۱۰۰۰ مشتری که به طور تصادفی انتخاب شده‌اند. یک نامه آزمایشی را می فرستد. * با استفاده از رفتار خرید گذشته مشتریان ( تعداد ماه‌های تا آخرین خرید و تعداد کتاب‌های خریداری شده) برای تخمین مدل انتخاب صفر و یک (که دو گزینه انتخاب. خریدن و نخریدن هستند) استفاده می‌کنیم . * برای تعیین مدل. جزء قطعی تابع مطلوبیت خرید نکردن را برابر صفر قرار می‌دهيم (یعنی 7۳۰ ‎(Noo‏ جزء قطعی تابع مطلوبیت خرید کتاب عبارت است از: ,0,6 + ,۵,۲ +2۵ ,4« تعداد ماه‌های تا آخرین خرید مشتری < از موسسه کتاب با پست و © تعداد كتابهاى خريدارى شده از موسسه توسط مشتری ۶ است.

صفحه 21:
Sh بست 1 * باتوجه به ۱۲/ - © مدل تنها 17 درصد از عدم قطعيت را پوشش داده است که مقدار بسیار کمی می باشد فلذا با استفاده از استراتژی زیر معنی داری کاربردی مدل را مورد بررسی قرار میدهیم. ۱ ‎(S)xR+Cr$)X0- B)>- or p>e‏ نفی‌ستادن نامه فرستادن نامه نخریدن ‎Ars‏ ۹۰ خریدن ۳ ۳۸

صفحه 22:

صفحه 23:
* فرض های مدل % فرد از ميان تمام گزینه‌های موجود. گزینه‌ای را که دارای بیشترین مطلوبیت است. انتخاب می‌کند که اين یعنی: ‎suchthat u, =max_-{u,}‏ ۲ عز ‎Choose‏ 7 مطلوبیت هر گزینه. که برای هر فرد مشخص است. معلوم نبوده و نمی‌تواند دقيقاً توسط مدلساز تعيين كردد. ** مانند مدل صفر و يك مطلوبيت را به دوجزء قطعى و غير قطعى تقسيم مى ‎eS‏ * احتمال اينکه یک فرد گزینه !را از بین تمام گزینه‌های موجود انتخاب کند برابر است پا: ‎Pru, =max.,{u,;})‏ =Pru>u and u>u and.and u,>u,)

صفحه 24:
a —— براى درك لزوم مدل #دمما در ابتدا به مدل #ادمم جند كزينه اى مى يردازيم. در ابتدا وضعيت انتخاب با سه گزینه را در نظر می‌گیریم. اگر ما قیدی به مدل اعمال نکنیم. آنگاه توزیع اجزا خطا با یک توزیع نرمال سه متغیره با یک ساختار کوواریانس کلی مشخص می‌گردد. مانند زیر: 2 P00, ۷,2 ) PrP, Px, hg ot Set gly ‏که‎ ‎_€; &; iE; oy. . ji. T° i ait ۷ ‏ی زگ‎ v از آننحا که احتمال اخاب با دو مقایسه نسبی به دست"می‌آید (یعنی و ) ما مى توانيم متغيرها را تغییر داده و ابعاد مساله را کاهش دهیم. بر ذادن* و ماتريس كوواريانس2 در اسلاید بعد اورده شده است. ,6 - ,26 ‎My‏

صفحه 25:
00-10, 000 که ز 21000 0. احتمال اشتراک ۳ به صورت زیر نوشته می‌شود: ۷ 7 ‎B= ۳ fi £0. A )ON AN,‏ ‎probt due lee ”‏ صفر و یک شکل بسته‌ای برای انتگرال بالا وجود ندارد. به علاوه با افزودن گزینه دیگری به مجموعه انتخاب. یک مرتبه دیگر انتگرالگیری نيز افزوده خواهد شد. اين مساله باعث افزایش قابل توجه پیچیدگی محاسباتی مساله می‌شود. ‏۲ برای انتگرال گیری به صورت عددی. می‌توان سطح زیر منحنی را با تقسیم خط مستقیم به تعدادی زیادی بازه کوچک. و تخمین سطح هر بازه به صورت مستطیل, محاسبه نمود.

صفحه 26:
مدل انتخاب 7۸ چند گزینه ای ۲ هرچه تعداد مرتبه‌های انتگرال‌گیری افزايش می‌یابد. بار محاسبات برای تخمین افزایش می‌یابد. ۲ اگر برای رسیدن به یک تخمین دقیق در یک مرحله انتگرال‌گیری نیاز به ۱۰۰ بازه باشد. ما برای انتگرال دو مرحله‌ای به ۰۰۱۰۰-۰ بازه نیاز داریم.

صفحه 27:
” هرجه تعداد گزینه‌های انتخابی بیشتر می‌شود. این رویکرد حتی برای کامپیوترهای پیشرفته از نظر محاسباتی غیرممکن می‌شود. اخيراً روش‌های متفاوتی برای تخمینی از پارامترهای مدل ۳8ج به صورت آسان‌تری توسعه یافته‌اند. این روش‌ها شامل ممان‌های شبیه‌سازی شده حداکثر مشابهت شبیه‌سازی شده و روش‌های مار کوف چین- مونت کارلو می‌باشند. متاسفانه بیشتر این روش‌ها تقریبا جدید بوده و کمتر به عنوان روشی استاندارد در پکیج‌های آماری موجود هستند. در اغلب مدل‌سازان انتخاب به دنبال تغییر فرضیات مدل #طصح برای ساده‌سازی مدل و کاهش محاسبات آن هستند. 53

صفحه 28:
ال مدل #عط جند كزينهاى كزينه متداول‌تری نسبت به مدل ‎Sool prob‏ چون از نظر محاسباتی قابل قبول‌تر بوده و فرم بسته‌ای برای احتمال انتخاب ارائه می دهد در مورد مدل ابا چند گزینه ای دو مورد زیر باید مد نظر قرار بگیرد. توزیع جزء خطای 8 به صورت زیر می باشد: ‎f(e;) =expt e,)expt expt ¢;)]‏ جزء‌های خطا مستقل بوده و دارای توزیع یکسان هستند. ‏مورد ۲ منجر به انحراف مهمی از ساختار کوواریانس کلی مدل ‎prob‏ که در بخش قبلی نمایش داده شد. می‌گردد. ما اين فرض را می‌کنيم چون منجر به ‏ساده‌سازی قابل توجهی می‌گردد: اين فرض باعث می‌شود که حداکثر مقدار متغیرهای تصادفی با توزیع دو نمایی. خود دارای توزیع دونمایی باشد.

صفحه 29:
مدل انتخاب 7۸ چند گزینه ای شکل بسته زیر برای مدل یدست خواهد آمد که بسیار مشابه ساختار اب صفر و یک ن است که مخرج اکنون شامل جمع اجزای نمایی تمام گزینه‌های ‎ltt‏ موجود السك (نه فقط دوتا) 060 هر 2 1 خصوصيات مدل #دمما جند كزينه اى : استقلال كزينههاى مختلف ‎(VID)‏ احتمالاً مختصرترين عبارت در مورد كاربرد بسيار مهم 110 اين است که در یک مجموعه انتخاب دو گزینه !و ز. وارد کردن گزینه > تاثيرى بر روى نسبت ندارد. به عبار جدید با کاستن از نسبت مشارکت انتخاب گزینه‌های موجوو هن سا رگ الب مشا ن كلك: من ‎BS‏

صفحه 30:
ای نز 8 & مدل انتخاب ابا چند گزینه ای ‎J‏ اطلاعات مربوط به چهار مارک 9) :© ط()۰ ۳" از طریق کارت های شناسایی بدست می آیند. ‏* در هر بار مراجعه به فروشگاه که خریدی از این گروه صورت گرفته است. ما اطلاعاتی در مورد قیمت طبقه هر محصول (قیمت هر اونس). چه محصولی به طور خاص ارائه شده است و اينکه هر محصول در کجای تبلیغات فروشگاه ارائه شده است. در اختیار داریم. این متغیرها به ترتیب ۳۵0,8۴ و /۴6969) نامگذاری شده‌اند. ‏* ازاطلاعات ۵۲ خانوار برای مدل استفاده می‌کنیم. ما دو مدل را تعیین می‌کنیم: مدلی که تنها دارای جزء جداکننده می باشند (که مدل صفر است و مبنای ارزیابی‌های ما را برای برازش تشکیل می‌دهد) و دیگری مدل دارای جزء جداكننده براساس محصول و سه متغير بازاريابى: 010808 . 60901008 و 0۳ می باشند.

صفحه 31:
Sh ‏مدل انتخاب مما جند كزينه اى‎ * نتایج مدل ایا برای داده های انتخاب مایع لباسشویی مدل تفکیکی مدل تفکیکی با متفیم‌های بازاریابی ریب حتطاى استاتدارد ضريب خطای استاندارد ‎wv 002 Gripe‏ 2 00 ‎YW «۳/۱ wisi‏ ۳۷/۱ ۷۳۳/۰ ‎nv. ۷/۰ agra‏ ۳۷۳/۰ ۱۳/۰ ‎Borice‏ 2/۰ ۱۳/۰ ‎wr/> ۳۹/۰ Brear‏ ‎wi: Bors‏ ۱۳۷/۰ ‎-A/t Me -۷ LL‏

صفحه 32:
در نظر گرفتن ناهمگونی * اگر خانوارهای موجود در لیست. مقادیر پارامترهای مختلفی در تابع بیت‌شان داشته باشند. چه اتفاقی می‌افتد؟ * پیامدهای این تفاوت‌ها را به سادگی می‌توان با درک اینکه تفاوت‌ها در ترجیح مارک‌های مختلف می‌توانند در جزء جداکننده تابع مطلوبیت نمایش داده شوند. آشکار کرد. بنابراین یک خانواده با وفاداری به یک مارک خاص. مقدار بزرگی پرای جزء جداکننده دارد * اگر خانواده‌ها در اجزای جداکننده تابع مطلوبیت‌شان ناهمگن باشند. آنگاه تخمین پارامترهای مدل زمانی که به طور متوسط تخمین زده می‌شوند. نسبت به مقدار واقعی انحراف خواهند داشت. 9 برای مقابله با ناهمگونی ها سه رویکرد اندازه‌گیری مستقیم تفاوت‌های فردی. مدلهاى كروه !و مدلهاى ضرايب تصادفى را در نظر مى كيريم.

صفحه 33:
1177ل" اندازه گیری مستقیم تفاوت های فردی * در این رویکرد تابع مطلوبیت را به صورت زیر تعریف می کنیم. 10۲ ‏یش‎ as Up =4,+ BioyLOY' + XB + * نتایج حاصل از در نظر گرفتن این رویکرد برای مثال قبل در جدول زیر آورده شده است.

صفحه 34:
re! ۹ 5 Brice B rear P pips Broy LL we Wes ۳/۸ ۷/۰ خطای استاندارد ws rw ۳/۰ الم ا للا لس مدل ‎KS‏ با متفيررهاى بازاريايى ضريب خطای استاندارد وام ۳/۰ ۳۷/۹ ۳/۰ ۳۷۳/۰ ۳/۰ ‎Ws 0/۰‏ ۳/۰ ۳۷۳/۰ ‎wy‏ ۳۹۷/۰ ‎wv‏ ۳۷۰ ‎A/T AS‏ مدل تنكيكى بامتفيررهاى بازاريايى ‎LOY x,‏ ‎we‏ خطای ‎th‏ ‏۳۹۹/۱ 2 ‎mv Yot/+‏ ۳۳/۰ ۳۹/۰ ‎M/s‏ ۰/- 1/۰ ۳/۰ ۳/۸ ۳۳/۰ ‎WWE‏ ۳۹۳/۰ -

صفحه 35:
ال Lutent «55 cb ‏مدل‎ * تفاوت‌ها بین تعداد کمی از گروه‌ها. که در داخل خود همگن هستند. وجود بارد. 1 ‎Bae,‏ زگ + و لوط + ورة - وربلا ‎__&xp@,+ X85)‏ ‎Dx Gy, + HB.)‏ | نجا که ما نمی‌توانیم عضویت در گروه #‌ا را مشاهده کنیم. ما احتمال انتخاب هر فرد را به صورت تر کیب وزنی از احتمال انتخاب میان گروه‌های مختلف تعریف می‌کنیم Bi #) Ody

صفحه 36:
مدل های ضرایب تصادفی * در این مدل فرض می‌شود که تفاوت میان افراد مختلف را می‌توان با برخی توزیع‌های پارامتریک (نرمال چندمتغیره) توصیف نمود. ‎=X" ten‏ ‎exp")‏ ‎EXP (‏ ‎Bb’ ~NB,D)‏ * اخيراً تعداد قابل توجهی از تحقیقات به یافتن روش‌هایی برای تخمین پارامترهای مدل اختصاص داده شده‌اند. برخی از موفق‌ترین این روش‌ها از عبارتی به نام نمونه گیر اط) استفاده می‌کنند. مراحل اين الگوریتم در فصل کتاب آورده شده است

صفحه 37:

صفحه 38:
مدل انتخاب بسا موی * در مدل #عط جندكزينهاى. ما فرض كرديم كه اجزى خطا در تابع مطلوبيت مستقل بوده و داراى توزيع يكسان هستند. اما مواقعى وجود دارند كه اين فرض بیش از حد موجب ساده‌سازی می‌گردد. به عنوان مثال. زمانی که ما با گزینه‌های انتخابى سروكار داريم که دارای مشابهت در تفاوت‌هایشان هستند. * رها کردن کامل فرض استقلال منجر به عدم وجود حل بسته‌ای برای احتمال انتخاب شده و ما را با یک مشکل تخمین از نظر محاسباتی وحشتناک مواجه ف كيد * به جای رها کردن فرض استقلال ما می‌توانیم ساختارى را به مدل تحميل كنيم كه متناظر با الگوی شباهت‌های میان گزینه‌های انتخابی است. یک راه انجام اين ‎US‏ ‏استفاده از مدل‌های لپا لووو(ا) است . * مدل فا لح( یک ساختار سلسله مراتبی را تحميل مى كند. اين روش گروه‌هایی از آیتم‌ها را ایجاد می‌کند که نسبتاً از مشابهت ب ‎apts‏ بت بهسایز آیتم‌های موجود در گروه‌های دیگر برخوردار هستند.

صفحه 39:
Dested Low ‏مدل انتخاب‎ * جزء خطای تابع مطلوبیت را (یعنی مشخصات غیرقابل اندازه‌گیری موثر بر انتخاب) به صورت مجموع دو جزء مدل می‌کنیم: یکی که مربوط به هر آیتم است (با عنوان مزبرای ایتم در گروه ع) و دیگری که مربوط به گروه است (با عنوان ‎ERM‏ می‌کنيم که . ووزگ به لور مستقل با واریانس‌های متفاوت توزیع شده‌اند. * تفاوت واریانس‌ها را با تفاوت در مقیاس‌بندی پارامترها در نظر می‌گیریم؛ به عنوان مثال. زرا برای نمایش پارامتر مقیاس برای خطای مربوط به هر آیتم ‎MES‏ مى بريم. * مطلوبیت آیتم !در گروه ع به صورت زير تعريف مى شود: ‎Uy, =ZY + Xie t Fic ۵‏ ‏* كه ص بردارى از متغيرهاى مربوط به كروه بوده و ‎Bic‏ متغیرهای مربوط ‎ ‏به هر آيتم است.

صفحه 40:
مدل انتخاب ‎QDested Low‏ * احتمال انتخاب آیتم !در گروه طط.ع به صورت زیر می‌تواند نوشته شود: ,۳ < م۲ احتمال انتخاب آیتم !از گروه < توسط فرد. به شرط انتخاب اين كروه است. این احتمال پرابر است با: ‎exp&f)‏ جر ‎2XPK.B)‏ 2 * احتمال انتخاب گروه « به صورت احتمال اینکه آیتم با بیشترین مطلوبیت در گروه « از بیشترین مقدار مطلوبیت آیتم‌ها در هریک از گروه‌های دیگر بزرگتر باشد. می‌باشد. این به صورت زیر می‌تواند نوشته شود: ‎p. =Pr&y+maxk,p +¢,.]+€,> Zy+‏ ‎maxk,6 +éiql+€,} forallcatjwries d‏

صفحه 41:
0 * از انجا که حداکر متفر مستقل دارای توزیع دونمایی نیز دارای توزیع دونمایی است. عبارت ‎Ec‏ + تا صورت . . یک مظیر با توزيع دونمایی با يارامتر موقعيت امساق اهس بير نوشت. ‎me Mic‏ * قرار دادن به چای در معادله. نتیجه می‌دهد: ی ۳-۷ * حال اگر ما اکنون فرض کنیم که جز ترکیبی خطای مستقل بوده و دارای توزیع مشابه با مبنای توزیع دو نمایی (با پارامتر مقیاس ) هستند معادله بالا می‌تواند به شکل مدل الط چند گزینه‌ای کاهش پیدا کند: اي دب ‎Pen‏ > مکی متیر ار + رتور 2 *

صفحه 42:
مدل ‎Dested Low GL!‏ * با ترکیب اجزا سل و ‎po‏ در معادلات. می‌توان احتمال غیرشرطی انتخاب آیتم ۱ از گروه »را به دست آورد: ‎AY + Mel tel. CXPW A) Mid),‏ ۱ ‎y+ Mel Mel, ey‏ اطع بز ‎DEXPEA)‏ 4 هر جه نسبت ‎Mel Mio‏ كوجكتر شو إد نشان دهئده افزايش ميان يغاي اتات در يك کی کته در حالت حدى. كه © به صفر نزديك می‌شود. ‎OLS‏ دهنده اين است كه هيج ارتباطی میان گزینه‌ها در گروه‌های مختلف وجود ندارد. به عبارت دیگر. افزايش جذابیت یک گزینه در یک گروه هیچ تاثیری بر احتمال انتخاب یک آیتم از یک گروه دیگر ندارد. Pe =

صفحه 43:
Dested Low ‏مدل انتخاب‎ اگر 2۱ ۸/۸ باشد نشان دهنده این است که عدم قطعیتی درارتباط با طبیعت انتخاب گروه وجود ندارد و یک مدل بط چند گزینه‌ای لععصس . برای تمام گزینه‌های انتخاب موجود. خواهیم داشت. مدل ابا لصو( را می‌توان با استفاده از حداکثر مشابهت کاملا مشابه مدل اب چند گزینه‌ای معمولی. تخمین زد. متاسفانه روند ابا لعح() در بسیاری از بسته‌های نرم‌افزاری آماری موجود نمی‌باشد. با این وجود راهی برای استفاده از بسته‌های فیط چند گزینه‌ای برای تخمین پارامترهای مدل ابا لوو() وجود دارد. كام هاى اين روش در فصل مدل ایا در کتاب درسی موجود می باشد.

صفحه 44:
a ‎Loot Os! Jas‏ لحطیی() - مثال رستوران ‏اطلاعات انتخاب ۲۰۰ دانش آموز در طول يك ترم را در اختيار داريم اطلاعات ارائه کوپن‌های تخفیف توسط هر رستوران در زمان انتخاب موجود است ‏فرض می‌کنیم که ۱) کوپن تنها در روزی که توزیع می‌شود معتبر است ۲) اگر ‏کوپنی موجود باشد. دانش آموز از آن مطلع است و بنابراین امکان دارد بر روی انتخاب آن تاثیرگذار باشد ‏جدول توزیع اطلاعات انتخاب دانش‌آموزان میان سه گزینه رستوران فضای باز (تحت سناریوهای مختلف تبلیغاتی) در اسلاید بعد آورده شده است

صفحه 45:
ال مدل انتخاب ‎Dested Logt‏ - مثال رستوران ‎obs sas ew‏ سه بزار ‎Pc Qs Deli ‏وقوع‎ PC Qs Deli ۳۳ A ۳۹ ov * * x ۳۳ 313 4 ۳۱ x x v 3 4 to ۳۹ x v x 3 ۳ ۳۸ ۳ x 7 7 0 tr 9 ۳ 7 x x ۳ 0 8 9 7 x v ۳ 34 ۱ 0 7 7 7 9 ۷ 0 1 2 2 7 ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 46:
ال مدل انتخاب ‎Dested boy‏ - مثال رستوران ینه‌ای در زیر آورده شده است ‎ger YB glob dae‏ چداکننده چز جداکننده و کوپن تخنین ضريب خطای استاندارد. ضريب خطای استاندارد. ‎1Vo/+ ۳/۰ a‏ ۳۳/۰ ۷۷/۰ ‎wis 002 00 ١‏ ‎ws B‏ 008 ‎“une ۹ 11‏ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 47:
مدل انتخاب ‎Dested boy‏ - مثال رستوران 5 با در نظر كرفتن ساختار مدل #عطا له به صورت زير نتايج تعديل شده مدل #عط ساده جند كزينه اى در اسلايد بعد آورده خواهد شد. یس Domestic Asian Deli Quik Stop . Pacific Comer

صفحه 48:
ال مدل انتخاب ‎Dested boy‏ - مثال رستوران قريب خطای اتاندارد دریک گروه ‎a,‏ ۳۳/۰ ۷/۰ ‎WA/+ 02 B‏ ‎a LL‏ ‎ow‏ گروه‌ها ‎rw Mav ۷‏ هه ۳/۰« ۹۷/۰ ‎LL‏ ا کل اي

صفحه 49:

صفحه 50:

بسم اهلل الرحمن الرحیم دانشگاه صنعتی اميرکبير (پلي تکنيک تهران) دانشکده مهندسي صنايع مدل انتخاب Logit استاد :دکتر جمال شهرابی ارائه دهنده :اسماعیل مرادی زمستان 1386 فهرست مطالب ‏ مقدمه ‏ کاربرد مدل ‏ مدل Logitصفر و یک ‏ مدل Logitچند گزینه ای ‏ مدل Nested Logit مقدمه مقدمه ‏ برخالف سایر روش‌های ارائه شده تاکنون برای تحلیل همبستگی ،روشی که در این فصل معرفی می‌شود غیرخطی است. احتمال انتخاب به خروجی‌های انتخابی گسسته که متغیر (یا متغیرهای) وابسته را تشکیل می‌دهند ،نسبت داده می‌شوند. از آنجا که احتمال بین صفر و یک قرار دارد ،نیاز به یک شکل تابع غیرخطی است تا بتوان اطالعات متغیرهای مستقل پیوسته را به بازه صفر و یک تبدیل کرد. ‏ شکل تابع مورد استفاده برای مدل احتمالی تا حد زیادی بستگی به توزیع مفروض ‏ ‏ برای خطای شناسایی ناشی از مدل دارد. ‏ مدل logitدارای تابعی با فرم بسته و سرراست می‌باشد که به سادگی با استفاده از روش‌های حداکثر مشابهت تخمین زده می‌شود. کاربرد های مدل کاربردهای مدل انتخاب Logit مدل‌های انتخاب گسسته چون مدل Logitبرای مطالعVه انواع مختلف رفتارهای انتخابی به کار رفته اند: ‏ انتخاب محل خرید انتخاب محل سکونت انتخاب شغل انتخاب مسیر بین دو مقصد ‏ انتخاب مارک جنس ‏ ‏ ‏ در دو زمینه انتخاب مسیر بین دو مقصد و مارک جVنس ،مقدار قابل توجVهی تحقیق و مدل‌سازی انجام شده است که در اسالیدهای بعد به آنها می پردازیم. مواردکاربرد – انتخاب مسیر گذر ‏ ‏VدلسVازVیاVنVتخابگVVسسته در ارVتباط ) :Ben-Akiva and Lerman (1985م ‌ ‌سVVازVی بVVا تVVحلیلسVVیستم‌هایحVملو نVVقل؛ تVVوسVعه فVVرآVیندهاییبVVراVیمVدل ‏VتخابVVکفVVرد ،خVانوادVه VیVVا ی شVVکسته نVVیاز سVVفر ،در سVVطح تVVحلیلرVفVتار اVن ‏Vت شVVرک . :Warner (1962) انتخاب گسسته متمرکز بر انتخاب صفر و یک چگونگی سفر ‏ ) :Ben-Akiva (1976مVطاVلعVاتی در زVمVینه اVنVتخابچVگونVگیمVسیر رVفVتنبVVه ‏Vنگتن نVVمونVه کVار بVVا اVسVتفادVه Vاز اVطVالعاتگVردآورVیشVده Vدر سVVاVل 1968واVش ، شVامVل 1136کVارVگر بVVود کVVه اVمVکاناVنVتخابدو یVVا تVVعVداد بVVیشتریاز سVVه روVش جVابVجایی را داVشVتند مواردکاربرد – انتخاب مارک کاال ‏ ‏VالعاتسVکن اV ) : Guadagni and Little (1983اوVلVیناVفرادVیبVVودنVد کVVه از اVط ‏VتخابVارVککVاVال م شVVده VمVوردVیبVVراVیکVاVلیبراVسVیونیVVکمVدل logitچVندگزین ‌هاVیاVن اVسVتفادVه VکVردنVد ؛ مVدلدر اVنVتخابگVروVه ،VشVرطVیبVVود یVVعنیآVنVها تVVنها بVVر ‌بVVینیاVینکه کVداVم مVارVکدر یVVکخVرید صVورVتگVرفVته از اVینگVروVه VاVنVتخاب پVVیش خVواVهد شVVد ،تVVاکVید کVردVند .آVنVها تVVواVنVستنداVثراVتقVیمتو تVVبلیغ را در اVنVتخاب قVیمت و تVVخمینزنVند و قVادر بVVه اVسVتفادVه Vاز مVدلبVVراVیتVVخمیناVالسVتیسیته ‌ها ب مارVک اVالسVتیسته cross priceبVVراVیهردو حVاVلتقVیمتتVVبلیغیو غVیرتبلیغیشVدند. مدل انتخاب Logitصفر و يک مدل انتخاب Logitصفر و يک ‏ یک فردخاص را در نظر بگیرید که از یک سوپرمارکت که دو مارک متفاوت از یک گروه محصول (مارک‌های Aو )Bرا ارائه می‌کند ،خرید می‌کند .قیت معمول این دو مارک Vیکسان است اما مارک Aتخفیف‌های متناوبی را ارائه می‌دهد و اغلب 20 ،15 ،10 و یا حتی 30سنت ارزانتر از محصول B است (که قیمتش ثابت باقی می‌ماند). ‏ هدف ما ساخت مدلی در سطح فرد برای تعیین احتمال خرید مارک Aبه صورت تابعی از تخفیف ارائه شده توسط مارک A می باشد تخفیف مارک A انتخاب مارک A انتخاب مارک B 00/0 1 7 10/0 1 6 15/0 3 3 20/0 4 1 30/0 4 0 مدل انتخاب Logitصفر و يک ‏ ‏ فرض های مدل: مطلوبیتانتخاب تابع در زمان مطلوبیت را هر گزینه انتخاب پیشنهادی به فرد بخشی از بخش قطعی ‌کند.مطلوبیت غیرقطیعVی بخش نمایش تابع زمان tبا از iدر گزینه مطلوبیت تامین شده توسط فراهم م مطلوبیتuitکه ما (بخشی ‌شود.مطلوبیت تجمعی (اثرات داده می به عنوان مدل‌کننده قادر به فاکتورهای ناشی از بیشترینآن با گزینه‌ها ،فرد گزینه با تعیین اطالعاتی‌کند. توجه رابه انتخاب م مطلوبیت انتخاب بین در متعدد موجود هستیم)می‌کند در خودانتخاب یک را غیرمشاهده‌دوای)گزینه وجود دارد ،فرد گزینه زمانی که تنها صورتیکه ،u1t> u2tدر غیر این صورت فرد گزینه دوم را انتخاب خواهد کرد. به دلیل غیرمنطقی بودن فرض دسترسی ما به عنوان مدل‌کننده به تمام ‏it تعیین تابعit اطالعات مورد نیاز برای it مطلوبیت هر فرد ،ما تابع مطلوبیت uitرا به دو جز می‌شکنیم : ‏U =v +  مدل انتخاب Logitصفر و يک ‏ بخش قطعی vitرا به صورت ترکیب خطی از متغیرهای مستقل مدل می‌کنیم. ‏ ‏vit  xit  ‏ ‏ از انجا که ما مقدار itرا مشاهده نمی‌کنیم uit ،را نمی‌شناسیم و نمی‌توانیم با قطعیت بگوییم که فرد کدام گزینه را انتخاب خواهد کرد. برداری از مشخصات اندازه گیری شده آیتمیi ‌که:در زمان می‌دانیم که فرد گزینه 1را در برابر گزینه 2است که انتخابزمان مستقیما کرد تا انتخاب خواهد .tرا تحت تاثیر قرار می دهد ‏ ‏ ‏x ‏ ‏ ‏ ‏ ‏x ‏u u 1t 1t 2t    2t 2t 1t ‏ ‏ ( 2 t   1t )  (x1t  x2 t ) ‏ تاما چهمقدارحد است( 2t   1t ) . را نمی‌دانیم با این وجود اگر تابع توزیع مربوط به متغیر تصادفی را بدانیم حداقل می‌توانیم بگوییم که احتمال برقراری نامساوی مدل انتخاب Logitصفر و يک ‏ فرض کنید ) f ( 2t   1tنشان دهنده تابع چگالی احتمال باشد در این صورت خواهیم داشت: ) f ( 2t   1t )( 2t   1t ) F((x1t  x2t ) ‏ ( x1t  x2 t ) ‏P1t  ‏ مقدار این احتمال به صورت گرافیکی عبارت است از: ) f ( 2 t   1t ‏p ) ( 2t   1t )  (x1  x2 مدل انتخاب Logitصفر و يک ‏ ‏ ‏ اگر فرض کنیم که ) ( 2t   1tدارای تابع چگالی توزیع نرمال باشد ،مدل احتمالی حاصل به عنوان مدل probitشناخته می‌شود. از آنجا که توزیع نرمال تجمعی دارای شکل بسته نمی‌باشد ،شکل تابع بسته‌ای برای احتمال انتخاب وجود ندارد .با این که این مساله غیر قابل حل نیست، مواقعی وجود دارد که بهتر است احVتمال انتخاب را به صورت تابعی از متغیرهای مستقل نمایش داد. به عنوان یک گزینه دیگر ،اگر ) ( 2 t   1t دارای تابع توزیع زیر باشد ،مدل حاصل Logitمیباشد. ]) exp[ ( 2t   1t ‏f ( 2t   1t )  2 )]) (1  exp[ ( 2t   1t مدل انتخاب Logitصفر و يک ‏ فایده حقیقی استفاده از توزیع Logitاین است که منجر به شکل بسته‌ای برای توصیف احتمال می‌گردد .زیرا: ]) exp[ ( 2t   1t 1 ‏( 2t   1t )  2 ) 1  exp( (x1t  x2t ) )]) (1  exp[ ( 2t   1t ( x1t  x2 t ) ‏P1t  ‏ ‏ ) exp(x1t  ‏P1t  ‏ ‏ ) exp(x1t  )  exp(x2 t  ‏ اگر عبارت ( expبه عنوان جذابیت گزینه iدر نظر بگیریم ،احتمال انتخاب گزینه ) xitرا 1با درصد مشارکت گزینه یک در مجموع جذابیت گزینه یک و دو تعیین می‌گردد. مدل انتخاب Logitصفر و يک ‏ مقادیر پارامترهای تابع مطلوبیت مدل Logitبه سادگی با استفاده از حداکثر مشابهت تخمین زده می‌شوند .در حداکثر مشابهت هدف ما این است که پارامترهای مدل (بردار ضرایب )را به نحوی انتخاب کنیم که احتمال اشتراک یا شباهت مشاهده خروجی‌های مدل را حداکثر کنیم .اگر فرض کنیم که مشاهدات از یکدیگر مستقل هستند ،این شباهت با ضرب احتماالت کلیه فرصت‌های انتخاب به دست می‌آید .راه ساده‌ایی برای نوشتن این رابطه به صورت زیر می باشد. ) (1 Yt ‏ ‏Yt 1t ) L t P (1  P1t از روش‌های عددی بهینه‌سازی ،برای انتخاب مقادیری از بتا که عبارت باال را حداکثر می‌کنند ،استفاده می‌شود. مدل انتخاب Logitصفر و يک ‏ روش حداکثرمشابهت برای مثال قبل ‏vAt aA   DAt ‏vBt aB ‏β 24/0 22/0 20/0 18/0 16/0 -6349/13 -5981/13 -9577/13 -7675/14 -0854/16 --4/3 -7875/13 -5266/13 -6341/13 -1924/14 -2349/15 -2/3 -1005/14 -6625/13 -5011/13 -7926/13 -5592/14 -0/3 -5734/14 -8871/13 -5350/13 -5736/13 -0661/14 -8/2 -2051/15 -3209/14 -7471/13 -5397/13 -7626/13 -6/2 ‏aA مدل انتخاب Logitصفر و يک خصوصیات مدل Logit معنی‌داری مدل :مقادیر حداکثر مشابهت برای دو مدل کامل و محدود شده ‏LLR LL (برخی پارامترها برابر صفر قرار داده شده اند) را بدست آورده و با Fو )  2(LLR  LLF که یک آماره نمایش میدهیم .آماره آزمون برابر است با کای با درجVه آزادی برابر با تعداد پارامترهایی که در مدل محدود شده برابر با صفر قرار داده شده‌اند؛ می باشد. ‏2 نیکویی برازش اشاره کنیم می توانیم به معیارهای AICو SCو شاخص مدل انتخاب Logitصفر و يک – مثال کتاب با پست ‏ ‏ ‏ کتاب با پست برای معرفی کتابی ،به 1000مشتری که به طور تصادفی انتخاب شده‌اند ،یک نامه آزمایشی را می فرستد. با استفاده از رفتار خرید گذشته مشتریان ( تعداد ماه‌های تا آخرین خرید و تعداد کتاب‌های خریداری شده) برای تخمین مدل انتخاب صفر و یک (که دو گزینه انتخاب ،خریدن و نخریدن هستند) استفاده می‌کنیم . برای تعیین مدل ،جزء قطعی تابع مطلوبیت خرید نکردن را برابر صفر قرار می‌دهیم (یعVنی .)v2 c 0جزء قطعی تابع مطلوبیت خرید کتاب عبارت است ازv1c a   1 x1c   2 x2 c : که x1cتعداد ماه‌های تا آخرین خرید مشتری c از موسسه کتاب با پست و x2cتعداد کتاب‌های خریداری شده از موسسه توسط مشتری cاست. مدل انتخاب Logitصفر و يک – مثال کتاب با پست ‏ 2 با توجه به  0 / 12مدل تنها 12درصد از عدم قطعیت را پوشش داده است که مقدار بسیار کمی می باشد فلذا با استفاده از استراتژی زیر معنی داری کاربردی مدل را مورد بررسی قرار میدهیم. 1 ‏pc  7 (6$)pc  ( 1$)(1  pc )  0 or نفرستادن نامه فرستادن نامه نخریدن 829 90 خریدن 43 38 مدل انتخاب Logitچند گزينه ای مدل انتخاب Logitچند گزينه ای فرض های مدل فرد از میان تمام گزینه‌های موجود ،گزینه‌ای را که دارای بیشترین مطلوبیت است ،انتخاب می‌کند که این یعنی: ‏Choose ‏i  C suchthat } ui maxjC {uj مطلوبیت هر گزینه ،که برای هر فرد مشخص است ،معVلوم نبوده و نمی‌تواند دقیق ًا توسط مدل‌ساز تعیین گردد. مانند مدل صفر و یک مطلوبیت را به دوجزء قطعی و غیر قطعی تقسیم می کنیم. احتمال اینکه یک فرد گزینه iرا از بین تمام گزینه‌های موجود انتخاب کند برابر است با: )} Pr(ui maxjC {uj ) ui  uj ‏and...and ‏ui  u2 ‏and ‏Pr(ui  u1 مدل انتخاب Logitچند گزينه ای ‏ ‏ برای درک لزوم مدل Logitدر ابتدا به مدل probitچند گزینه ای می پردازیم. در ابتدا وضعیت انتخاب با سه گزینه را در نظر می‌گیریم .اگر ما قیدی به مدل اعمال نکنیم ،آنگاه توزیع اجزا خطا با یک توزیع نرمال سه متغیره با یک ساختار کوواریانس کلی مشخص می‌گردد ،مانند زیر: که ‏ ‏  12 ‏12 1 2 13 1 3  ‏ ‏ ‏ 12 1 2  22 ‏ 23 2 3  ‏ 13 1 3  23 2 3  32  ‏ ‏ ‏ i2 واریانس و ‏ همبستگی بین ‏ ij  ‏i )  ~N(0,  و ‏i است. ‏j و از آنجا که احتمال انتخاب با دو مقایسه نسبی به دست می‌آید (یعنی قرار ) ما می با2   ‌توانیم متغیرها را تغییر داده و ابعاد مساله را کاهش دهیم1 . دادن  3  1 در اسالید بعد آورده ماتریس کوواریانس و ‏ 31  3   1 ‏ شده است 21  2   1 . مدل انتخاب Logitچند گزينه ای ‏  12   22  2 12  12   12   13   23  ‏ 2 ‏ 2 2 ‏ ‏ ‏ ‏ ‏ ‏ ‏ ‏ ‏ ‏ ‏ 2 ‏ ‏ 1 12 13 23 1 3 13  که . ij  pij i jاحتمال اشتراک p1به صورت زیر نوشته می‌شود: ‏f ( 21 , 31 ) 21 31 ‏ ‏ ‏v1  v3 ‏ ‏ ‏v1  v2 ‏p1  ‏ همانند مدل probitصفر و یک شکل بسته‌ای برای انتگرال باال وجود ندارد .به عالوه با افزودن گزینه دیگری به مجموعه انتخاب ،یک مرتبه دیگر انتگرال‌گیری نیز افزوده خواهد شد .این مساله باعث افزایش قابل توجه پیچیدگی محاسباتی مساله می‌شود. برای انتگرال‌گیری به صورت عددی ،می‌توان سطح زیر منحنی را با تقسیم خط مستقیم به تعدادی زیادی بازه کوچک ،و تخمین سطح هر بازه به صورت مستطیل ،محاسبه نمود. مدل انتخاب Logitچند گزينه ای ‏ ‏ هرچه تعداد مرتبه‌های انتگرال‌گیری افزایش می‌یابد ،بار محاسبات برای تخمین افزایش می‌یابد. اگر برای رسیدن به یک تخمین دقیق در یک مرحله انتگرال‌گیری نیاز به 100 بازه باشد ،ما برای انتگرال دو مرحله‌ای به 100×100=10000بازه نیاز داریم. مدل انتخاب Logitچند گزينه ای ‏ ‏ هرچه تعداد گزینه‌های انتخابی بیشتر می‌شود ،این رویکرد حتی برای کامپیوترهای پیشرفته از نظر محاسباتی غیرممکن می‌شود. اخیراً روش‌های متفاوتی برای تخمینی از پارامترهای مدل probitبه صورت آسان‌تری توسعه یافته‌اند .این روش‌ها شامل ممان‌های شبیه‌سازی شده ،حداکثر مشابهت شبیه‌سازی شده و روش‌های مارکوف چین -مونت‌کارلو می‌باشند. متاسفانه بیشتر این روش‌ها تقریب ًا جدید بوده و کمتر به عنوان روشی استاندارد در پکیج‌های آماری موجود هستند .در نتیجه اغلب مدل‌سازان انتخاب به دنبال تغییر فرضیات مدل probitبرای ساده‌سازی مدل و کاهش محاسبات آن هستند. مدل انتخاب Logitچند گزينه ای ‏ ‏ .1 مدل logitچندگزینه‌ای گزینه متداول‌تری نسبت به مدل probitاست چون از نظر محاسباتی قابل قبول‌تر بوده و فرم بسته‌ای برای احتمال انتخاب ارائه می‌دهد. در مورد مدل Logitچند گزینه ای دو مورد زیر باید مد نظر قرار بگیرد. توزیع جزء خطای  iبه صورت زیر می باشد: ]) f ( i ) exp(  i ) exp[ exp(  i .2 جزء‌های خطا مستقل بوده و دارای توزیع یکسان هستند. ‏ مورد 2منجر به انحراف مهمی از ساختار کوواریانس کلی مدل probitکه در بخش قبلی نمایش داده شد ،می‌گردد .ما این فرض را می‌کنیم چون منجر به ساده‌سازی قابل توجهی می‌گردد :این فرض باعث می‌شود که حداکثر مقدار متغیرهای تصادفی با توزیع دو نمایی ،خود دارای توزیع دونمایی باشد. مدل انتخاب Logitچند گزينه ای ‏ شکل بسته زیر برای مدل یدست خواهد آمد که بسیار مشابه ساختار logitصفر و یک است .تنها تفاوت این است که مخرج اکنون شامل جمع اجزای نمایی تمام گزینه‌های انتخابی موجود است (نه فقط دوتا). ) exp(vi ‏pi  )  k exp(vk ‏ ‏ ‏ خصوصیات مدل Logitچند گزینه ای : استقالل گزینه‌های مختلف ()IIA احتماالً مختصرترین عبارت در مورد کاربرد بسیار مهم IIAاین است که در یک مجموعه انتخاب دارای دو گزینه iو ، jوارد کردن گزینه kتاثیری بر روی نسبت ندارد .به عبارت دیگر ،گزینه جدید با کاستن از نسبت مشارکت انتخاب گزینه‌های موجود در  i /  j مجموعه ،در انتخاب مشارکت می‌کند. مدل انتخاب Logitچند گزينه ای ‏ ‏ ‏ اطالعات مربوط به چهار مارک Tide ، Wisk ،Era ،Surfاز طریق کارت های شناسایی بدست می آیند. در هر بار مراجعه به فروشگاه که خریدی از این گروه صورت گرفته است ،ما اطالعاتی در مورد قیمت طبقه هر محصول (قیمت هر اونس) ،چه محصولی به طور خاص ارائه شده است و اینکه هر محصول در کجای تبلیغات فروشگاه ارائه شده است ،در اختیار داریم .این متغیرها به ترتیب PRICE، DISP و FEATنامگذاری‌شده‌اند. ازاطالعات 52خانوار برای مدل استفاده می‌کنیم .ما دو مدل را تعیین می‌کنیم: مدلی که تنها دارای جزء جداکننده می باشند (که مدل صفر است و مبنای ارزیابی‌های ما را برای برازش تشکیل می‌دهد) و دیگری مدل دارای جزء جVداکننده براساس محصول و سه متغیر بازاریابی PRICE، DISP :و FEATمی باشند. مدل انتخاب Logitچند گزينه ای ‏ نتایج مدل Logitبرای داده های انتخاب مایع لباسشویی مدل تفکیکی با متغیرهای بازاریابی مدل تفکیکی ضریب خطای استاندارد ضریب خطای استاندارد 635/0 186/0 875/0 208/0 403/1 168/0 107/1 180/0 -047/0 216/0 372/0 234/0 ‏ PRICE -508/0 111/0 ‏ FEAT 639/0 273/0 ‏ DIPS 681/0 229/0 ‏aTIDE ‏aWISk ‏aERA ‏LL -8/417 -8/380 در نظر گرفتن ناهمگونی ‏ اگر خانوارهای موجود در لیست ،مقادیر پارامترهای مختلفی در تابع مطلوبیت‌شان داشته باشند ،چه اتفاقی می‌افتد؟ پیامدهای این تفاوت‌ها را به سادگی می‌توان با درک اینکه تفاوت‌ها در ترجیح مارک‌های مختلف می‌توانند در جزء جداکننده تابع مطلوبیت نمایش داده شوند، آشکار کرد .بنابراین یک خانواده با وفاداری به یک مارک خاص ،مقدار بزرگی برای جزء جداکننده دارد ‏ اگر خانواده‌ها در اجزای جداکننده تابع مطلوبیت‌شان ناهمگن باشند ،آنگاه تخمین پارامترهای مدل زمانی‌که به طور متوسط تخمین زده می‌شوند ،نسبت به ‏ مقدار واقعی انحراف خواهند داشت. ‏ برای مقابله با ناهمگونی ها سه رویکرد اندازه‌گیری مستقیم تفاوت‌های فردی، مدل‌های گروه latentو مدل‌های ضرایب تصادفی را در نظر می گیریم. اندازه گیری مستقیم تفاوت های فردی ‏ در این رویکرد تابع مطلوبیت را به صورت زیر تعریف می کنیم. ‏h ‏y ‏it it ‏nh ‏LOYi h  ‏uith ai   LOYLOYi h  xit    ith ‏ نتایج حاصل از در نظر گرفتن این رویکرد برای مثال قبل در جدول زیر آورده شده است. مدل تفکیکی مدل تفکیکی با متغیرهای بازاریابی مدل تفکیکی با متغی/رهای بازاریابی و متغیر LOY ضریب خطای استاندارد ضریب خطای استاندارد ضریب خطای استاندا رد ‏aTIDE 635/0 186/0 875/0 208/0 394/1 308/0 ‏aWISk 403/1 168/0 107/1 180/0 254/0 266/0 ‏aERA -047/0 216/0 372/0 234/0 363/0 319/0 ‏ PRICE -508/0 111/0 -640/0 -165/0 ‏ FEAT 639/0 273/0 990/0 360/0 ‏ DIPS 681/0 229/0 143/1 321/0 ‏ LOY 681/0 229/0 009/4 293/0 ‏LL -8/417 -8/380 -2/186 مدل های گروه Latent ‏ تفاوت‌ها بین تعداد کمی از گروه‌ها ،که در داخل خود همگن هستند ،وجود دارد. ‏uit|s ai|s  xit  s   it|s ) exp(ai|s  xit  s ‏Pit|s  ) k exp(ak|s  xkt s ‏ از آنجا که ما نمی‌توانیم عضویت در گروه Latentرا مشاهده کنیم ،ما احتمال انتخاب هر فرد را به صورت ترکیب وزنی از احتمال انتخاب میان گروه‌های مختلف تعریف می‌کنیم ‏pith   s pit|s ‏s مدل های ضرایب تصادفی ‏ در این مدل فرض می‌شود که تفاوت میان افراد مختلف را می‌توان با برخی توزیع‌های پارامتریک (نرمال چندمتغیره) توصیف نمود. ‏uith  xit  h   ith ) exp(xit  h ‏P  ) k exp(xkt h ‏h ‏it ‏ ) h ~N( , D اخیراً تعداد قابل توجهی از تحقیقات به یافتن روش‌هایی برای تخمین پارامترهای مدل اختصاص داده شده‌اند .برخی از موفق‌ترین این روش‌ها از عبارتی به نام نمونه‌گیر Gibbsاستفاده می‌کنند .مراحل این الگوریتم در فصل کتاب آورده شده است Nested Logit مدل انتخاب مدل انتخاب Nested Logit ‏ در مدل logitچندگزینه‌ای ،ما فرض کردیم که اجزی خطا در تابع مطلوبیت مستقل بوده و دارای توزیع یکسان هستند .اما مواقعی وجود دارند که این فرض بیش از حد موجب ساده‌سازی می‌گردد ،به عنوان مثال ،زمانی‌که ما با گزینه‌های انتخابی سروکار داریم که دارای مشابهت در تفاوت‌هایشان هستند. ‏ ‏ ‏ رها کردن کامل فرض استقالل منجر به عدم وجود حل بسته‌ای برای احتمال انتخاب شده و ما را با یک مشکل تخمین از نظر محاسباتی وحشتناک مواجه می‌کند. به جای رها کردن فرض استقالل ما می‌توانیم ساختاری را به مدل تحمیل کنیم که متناظر با الگوی شباهت‌های میان گزینه‌های انتخابی است .یک راه انجام این کار استفاده از مدل‌های Nested Logitاست . مدل Nested Logitیک ساختار سلسله مراتبی را تحمیل می‌کند .این روش گروه‌هایی از آیتم‌ها را ایجاد می‌کند که نسبت ًا از مشابهت بیشتری نسبت به سایر آیتم‌های موجود در گروه‌های دیگر برخوردار هستند. مدل انتخاب Nested Logit ‏ ‏ ‏ جزء خطای تابع مطلوبیت را (یعنی مشخصات غیرقابل اندازه‌گیری موثر بر انتخاب) به صورت مجموع دو جزء مدل می‌کنیم :یکی که مربوط به هر آیتم است (با عنوان  icبرای آیتم iدر گروه )cو دیگری که مربوط به گروه است فرض می‌کنیم که و  icبه  c (با عنوان ) c . طور مستقل با واریانس‌های متفاوت توزیع شده‌‌اند. تفاوت واریانس‌ها را با تفاوت در مقیاس‌بندی پارامترها در نظر می‌گیریم؛ به عنوان مثال  ic ،را برای نمایش پارامتر مقیاس برای خطای مربوط به هر آیتم کار می‌بریم. به ic مطلوبیت آیتم iدر گروه cبه صورت زیر تعریف می شود: ‏   ic   c ‏uic  zc  xic ‏ که zcبرداری از متغیرهای مربوط به گروه بوده و به هر آیتم است. ‏ ‏xicبردار متغیرهای مربوط مدل انتخاب Nested Logit ‏ احتمال انتخاب آیتم iدر گروه ،c، picبه صورت زیر می‌تواند نوشته شود: ‏pic  pi|c pc pi|cاحتمال انتخاب آیتم iاز گروه cتوسط فرد ،به شرط انتخاب این گروه است .این احتمال برابر است با: ) ‏exp(xic ‏Pi|c  )  k exp(xkc ‏ احتمال انتخاب گروه cبه صورت احتمال اینکه آیتم با بیشترین مطلوبیت در گروه cاز بیشترین مقدار مطلوبیت آیتم‌ها در هریک از گروه‌های دیگر بزرگتر باشد ،می‌باشد .این به صورت زیر می‌تواند نوشته شود: ‏pc Pr{zc  max[xic    ic ]   c  zd  ‏    id ]   d } forallcate ‏max[xid ‏gories ‏d مدل انتخاب Nested Logit ‏ از انجا که حداکثر متغیر مستقل دارای توزیع دونمایی نیز دارای توزیع دونمایی ،یک  c متغیر با توزیع [maxبه صورت ] ic    icمxی‌تواند است ،عبارت مقیاس1 ، ] xjc ) icو دونمایی با پارامتر موقعیت پارامتر[ln (exp ‏ ‏j ‏ ic ‏ ic نوشت. قرار دادن به جVای در معادله ،نتیجه می‌دهد: ‏ حال اگر ما اکنون فرض کنیم که جVز ترکیبی خطای مستقل بوده و دارای توزیع مشابه با مبنای توزیع دو نمایی (با پارامتر مقیاس ) هستند معادله باال می‌تواند به شکل مدل logitچندگزینه‌ای کاهش پیدا کند: ‏ ‏pc Pr{zc   c   c  zd   c   d }forallcate ‏gories ‏d ‏ ‏ ) exp( c zc   c /  ic ln jc exp(xjc ) ic )d exp( c zd   c / ic ln j d exp(xjd )ic  ‏ ‏pc  مدل انتخاب Nested Logit ‏ با ترکیب اجزا pi|cو pcدر معادالت ،می‌توان احتمال غیرشرطی انتخاب آیتم i از گروه cرا به دست آورد: ) exp( c zc   c /  ic ln  jc exp(xjc ) ic ‏ ‏ ) exp(xic  ‏pic  ) k exp(xkc ) d exp( c zd   c / ic ln jd exp(xjd )ic ‏ ‏ ‏ هر چه نسبت  c /  icکوچکتر شود نشان دهنده افزایش همبستگی میان گزینه‌های انتخاب در یک گروه است .در حالت حVدی ،که  c /  icبه صفر نزدیک می‌شود ،نشان دهنده این است که هیچ ارتباطی میان گزینه‌ها در گروه‌های مختلف وجود ندارد .به عبارت دیگر ،افزایش جذابیت یک گزینه در یک گروه هیچ تاثیری بر احتمال انتخاب یک آیتم از یک گروه دیگر ندارد. مدل انتخاب Nested Logit ‏ اگر  c /  ic 1باشد نشان دهنده این است که عدم قطعیتی درارتباط با طبیعت انتخاب گروه وجود ندارد و یک مدل logitچندگزینه‌ای ، non-nestedبرای تمام گزینه‌های انتخاب موجود ،خواهیم داشت. ‏ ‏ مدل Nested Logitرا می‌توان با استفاده از حداکثر مشابهت کام ً ال مشابه مدل logitچندگزینه‌ای معمولی ،تخمین زد. متاسفانه روند Nested Logitدر بسیاری از بسته‌های نرم‌افزاری آماری موجود نمی‌باشد .با این وجود راهی برای استفاده از بسته‌های logitچندگزینه‌ای برای تخمین پارامترهای مدل Nested Logitوجود دارد .گام‌های این روش در فصل مدل Logitدر کتاب درسی موجود می باشد. مدل انتخاب – Nested Logitمثال رستوران ‏ ‏ اطالعات انتخاب 200دانش آموز در طول یک ترم را در اختیار داریم اطالعات ارائه کوپن‌های تخفیف توسط هر رستوران در زمان انتخاب موجود است ‏ ‏ فرض می‌کنیم که )1کوپن تنها در روزی که توزیع می‌شود معتبر است )2اگر کوپنی موجود باشد ،دانش‌آموز از آن مطلع است و بنابراین امکان دارد بر روی انتخاب آن تاثیرگذار باشد جدول توزیع اطالعات انتخاب دانش‌آموزان میان سه گزینه رستوران فضای باز (تحت سناریوهای مختلف تبلیغاتی) در اسالید بعد آورده شده است مدل انتخاب – Nested Logitمثال رستوران سناریوی تبلیغاتی سهم بازار تعداد دفعات وقوع ‏Deli ‏QS ‏PC × × × 57 39 28 33 ‏ × × 31 48 19 32 × ‏ × 36 25 56 19 ‏ ‏ × 16 38 31 31 × × ‏ 30 43 33 23 ‏ × ‏ 13 46 23 31 × ‏ ‏ 11 0 64 36 ‏ ‏ ‏ 6 33 17 50 ‏Deli ‏QS ‏PC مدل انتخاب – Nested Logitمثال رستوران نتایج مدل Logitساده چندگزینه‌ای در زیر آورده شده است مدل دارای تنها جز جداکننده جز جداکننده و کوپن تخفیف ضریب خطای استاندارد ضریب خطای استاندارد ‏a1 213/0 175/0 203/0 177/0 ‏a2 142/0 178/0 122/0 180/0 479/0 180/0 ‏β ‏LL -0/219 -4/215 مدل انتخاب – Nested Logitمثال رستوران ‏ با در نظر گرفتن ساختار مدل nested logitبه صورت زیر نتایج تعدیل شده مدل logitساده چند گزینه ای در اسالید بعد آورده خواهد شد. ‏Asian ‏Pacific Corner ‏Domestic ‏Quik Stop ‏Deli مدل انتخاب – Nested Logitمثال رستوران خطای استاندارد ضریب در یک گروه ‏a1 122/0 178/0 ‏β 995/0 278/0 ‏LL -4/90 بین گروه‌ها ‏γ1 881/0 268/0 ‏φ -012/0 257/0 ‏LL -3/121 LLک//ل -7/211 ؟ با تشکر از توجه شما
39,000 تومان