صفحه 1:
صفحه 2:
Mery
دانشگاه صنعتی امیر کبیر
(پلي تکنیک تهران)
دانشکده مهندسي صنایع
مدل انتخاب Logit
استاد: دکتر جمال شهرابی
ارائه دهنده: اسماعیل مرادی
زستان ۱۳۸
صفحه 3:
ال
* مقدمه
* کاربرد مدل
* مدل ابا صفر و یک
* مدل ابا چند گزینه ای
QDested Loca Js *
صفحه 4:
صفحه 5:
a :
* برخلاف ساير روشهاى ارائه شده تاكنون براى تحليل همبستكى. روشى كه در
اتن فصل معرفى مَى شود خيرخطى امنت.
* احتمال انتخاب به خروجىهاى انتخابى كسسته كه متغير (يا متغيرهاى) وابسته را
تشکیل میدهند. نسبت داده میشوند.
1 صفر و یک قرار دارد. نیاز به یک شکل تابع غیرخطی است
تا بتوان اطلاعات متغیرهای مستقل پیوسته را به بازه صفر و یک تبدیل کرد.
* شکل تابع مورد استفاده برای مدل احتمالی تا حد زیادی بستگی به توزیع مفروض
برای خطای شناسایی ناشی از مدل دارد.
* مدل ابا دارای تابعی با فرم بسته و سرراست میباشد که به سادگی با استفاده از
روشهای حداکثر مشابهت تخمین زده میشود.
صفحه 6:
صفحه 7:
مدلهای انتخاب گسسته چون مدل ایا برای مطالعه انواع مختلف رفتارهای
انتخابی به کار رفته اند:
* انتخاب محل خريد
** انتخاب محل سکونت
* انتخاب شغل
انتخاب مسير بين دو مقصد
* انتخاب مارک جنس
در دو زمینه انتخاب مسیر بین دو مقصد و مارک جنس. مقدار قابل توجهی تحقیق و
مدلسازی انجام شده است که در اسلایدهای بعد به آنها می پردازيم.
صفحه 8:
مواردکاربرد - زد نتخاب مسير گذر
* (1966) مورا اجه و102 مدلس ازیلنتخابگسسته در ارتباط
بسا تسحلیلسیستجایحملو نقل؛ تسوسعه فسرآیندهاییسرلیمدلسانی
شکسته نیاز سفر, در سطح تسحلیلیفتار لنتخایسکفنرد. خانوادد یا
شرکت
* (0906) مه انتخاب گسته متمرکز پر انتخاب صفر و یک
چگونگی سفر
* (0976) 259: مطااماتی در زمینه لنتخابچگرنگیمسیر وفترسه
کار بسالستفاده از لطلهاتگردآوییشده در سلل۱۹1۸ ولشنگتن نسونه
شامل۱۱۳۹ کارگر بسود که لمکانلنتخابدو یبا تسعداد بسیشتریاز سه رهش
جلبجایی را دلشتند
صفحه 9:
VS Sle qlee دوتراکدراوف
* (1969) عاا اجه مطل() : ایلیرلفرادیودند که از لطاهانلسکن
شده موردییسرلیکابرلسیون یسکمد لاب چند گز ینهلیانتخا ما رک ک لا
لستفادد کردند ؛ مدلدر لنتخابگ روص شرطىئيود یسعنیلنها تسنها بسر
پسیشوسینیلینکه کلم مارکدر یسکخرید صورتگرفته از اینگرود لنتخاب
خولهد شد تساکید کردند نها تسوانستندلثرلقیمتو تسبلیغ را در لنتخاب
مارکتسخمیبزنند و قادر بسه لستفاده از مدلبسرلیتسخمیر | لاستیسیته قیمقا و
اسلاستیسته ۳۳۸ 7۳55 بسرلیهردو حاسلقیستسبلیفیو غیر تبلیفیشدند
صفحه 10:
صفحه 11:
ال ۳
مدل انتخاب ae bout و یک
یک فردخاص را در نظر بگیرید که از یک یر 5906 ae
سوپرمارکت که دو مارک متفاوت از یک
گروه محصول (مارکهای 9 و ©) را ارائه
میکند. خرید میکند. قیت معمول ابن
مارکد یکسان است اما مارک ) تخفی
متناوبی را ارائه میدهد و اغلب ۰۱۰ ۸۱۵ ۲۰
و یا حتی ۳۰ سنت ارزانتر از محصول 8
است (که قیمتش ثابت باقی میماند). wre 9 3
* هدف ما ساخت مدلی در سطح فرد برای
تعيين احتمال خريد مارك 9) به صورت
تابعی از تخفیف ارائه شده توسط مارک 49
5 ‘ We
‘ th
می باشد
صفحه 12:
* فرض های مدل:
ie
اترات تجمعی مطاوییت
ناشی از فاکتورهای
متعدد غیرمشاهدهای)
دی به فره SDD
تامين شده| (بخشی از تابع مطلوبیت که ما
به عنوان مدلکننده قادر به
فرد گزینه | تعیین آن با توجه به اطلاعات
وجود دار موجود خود هستیم) A
ار غیر اين صو: تزینه دوم را انتخاب
الك به تمام
اطلاعات مورد ع +برح() تابع مطلوییت فد را
صفحه 13:
بخش قطعى #رارا به صورت تركيب خطی از متفیرهای مستقل مدل میکنیم.
* از انجا که ما مقدار زا مشاهده نمیکنيم. #ا
بگوییم که فرد کدام گزینه را انتخاب خوا
* میدانیم که فرد گزینه ۱ را در برابر گزینه
Xp Brey <رع 6
XB > )>( -بع) ی
* ما مدا ( راشي دلتهمبا )وجوه اكر تيع توزيع مربوط به متغير تصادلى را بدايم حداقل مىتوايم بكوبيم كد احتمال برقرارى تامساوى
تا چه حد است.
صفحه 14:
* فرض کنید (,,ع -,,ع) نشان دهنده تابع چگالی احتمال باشد در این صورت
خواهيم داشت: ۲
كن
* مقدار اين احتمال به صورت كرافيكى عبارت است از:
Fle e- &4)
ار
صفحه 15:
مدل انتخاب ابا صفر و یک
* اگر فرض کنیم كه )6.0 Ere” دارای تابع چگالی توزیع نرمال باشد. مدل
احتمالی حاصل به عنوان مدل هس شناخته میشود.
9 از آنجا که توزیع نرمال تجمعی دارای شکل بسته نمیباشد. شکل تابع بستهای
برای احتمال انتخاب وجود ندارد. با اين که این مساله غیر قابل حل نیست:
مواقعی وجود دارد که بهتر است احتمال انتخاب را به صورت تابعی از متغیرهای
مستقل نمایش داد.
* به عنوان یک گزینه دیگر, اگر (2:4 -6©راى تابع توزیع زیر باشد. مدل
حاصل #با میباشد.
[(ر6 6 expt = ليع - ,۶
)]),¢ -6) ۵0۲ +)
صفحه 16:
ال ۳
مدل انتخاب ابا صفر و یک
* فایده حقیقی استفاده از توزیع ایا این است که منجر به شکل بستهای برای
توصیف احتمال میگردد. زیرا:
۱
“\rexpt (x, x)
I> ا 96,8 - به
exp, 6)+exp&, 6)
Sate SI ( ,7006© به عنوان جذابيت كزينه ١ در نظر بكيريم؛ احتمال انتخاب كزيته
۱ با درصد مشارکت گزینه یک در مجموع جذابیت گزینه یک و دو تعیین میگردد.
_ pede exp (e,,- ey]
A 7
E> Ey)
صفحه 17:
مدل انتخاب ابا صفر و یک
مقادیر پارامترهای تابع مطلوبیت مدل الا به سادگی با استفاده از حداکثر
مشابهت تخمین زده میشوند. در حداکثر مشابهت هدف ما این است که
پارامترهای مدل (بردار ضرایب 6 را به نحوی انتخاب کنیم که احتمال
اشتراک يا شباهت مشاهده خروجیهای مدل را حداکثر کنیم. اگر فرض کنیم
که مشاهدات از یکدیگر مستقل هستند. این شباهت با ضرب احتمالات کلیه
فرصتهای انتخاب به دست میآید. راه سادهایی برای نوشتن این رابطه به
صورت زير می باشد.
7,<1, Pi 0 (۲ 2
* از روشهای عددی بهینهسازی. برای انتخاب مقادیری از بتا که عبارت بالا را
حداکثر میکنند. استفاده میشود.
صفحه 18:
مدل انتخاب ae bout و یک
دوش حدافتر بت بای ما بل
Va, =A, + BD,
ورت جح .جرلا
B
w we ws Wwe Ww
aren العام ۳ neu wee ول
ae arrive mare rear erwin 330
3 11 sarin ۳ ۳/۳
3 العم ۳ ۳ ااا nevus
ovr oar ۳ vein ال vie
صفحه 19:
مدل انتخاب ابر صفر و یک
* خصوصیات مدل بسا
۲ معنیداری مدل: مقادیر حداکثر مشابهت برای دو مدل کامل و محدود شده
(پزخی پارامتزها بزابر صفز فرار:داده شده اند) را پذست آورده ویا لیا TT
(بلآ -بلل)۲-
نمایش ميدهیم. آماره آزمون برایر است با كه یک آماره
کای با درچه آزادی برابر با تعداد پارامترهایی که در مدل محدود شده برابر با
صفر قرار داده شدهاند؛ می باشد.
۲ 3
نيكويى برازش م
می توانیم به معیارهای BIO و(96) و شاخص اشاره کنیم
7
صفحه 20:
me re eg per em
* کتاب با پست برای معرفی کتابی. به ۱۰۰۰ مشتری که به طور تصادفی انتخاب
شدهاند. یک نامه آزمایشی را می فرستد.
* با استفاده از رفتار خرید گذشته مشتریان ( تعداد ماههای تا آخرین خرید و تعداد
کتابهای خریداری شده) برای تخمین مدل انتخاب صفر و یک (که دو گزینه
انتخاب. خریدن و نخریدن هستند) استفاده میکنیم .
* برای تعیین مدل. جزء قطعی تابع مطلوبیت خرید نکردن را برابر صفر قرار
میدهيم (یعنی 7۳۰ (Noo جزء قطعی تابع مطلوبیت خرید کتاب عبارت است
از: ,0,6 + ,۵,۲ +2۵ ,4« تعداد ماههای تا آخرین خرید مشتری <
از موسسه کتاب با پست و © تعداد كتابهاى خريدارى شده از موسسه
توسط مشتری ۶ است.
صفحه 21:
Sh
بست 1
* باتوجه به ۱۲/ - © مدل تنها 17 درصد از عدم قطعيت را پوشش داده است که مقدار
بسیار کمی می باشد فلذا با استفاده از استراتژی زیر معنی داری کاربردی مدل را مورد بررسی
قرار میدهیم.
۱
(S)xR+Cr$)X0- B)>- or p>e
نفیستادن نامه فرستادن نامه
نخریدن Ars ۹۰
خریدن ۳ ۳۸
صفحه 22:
صفحه 23:
* فرض های مدل
% فرد از ميان تمام گزینههای موجود. گزینهای را که دارای بیشترین مطلوبیت
است. انتخاب میکند که اين یعنی:
suchthat u, =max_-{u,} ۲ عز Choose
7 مطلوبیت هر گزینه. که برای هر فرد مشخص است. معلوم نبوده و نمیتواند
دقيقاً توسط مدلساز تعيين كردد.
** مانند مدل صفر و يك مطلوبيت را به دوجزء قطعى و غير قطعى تقسيم مى
eS
* احتمال اينکه یک فرد گزینه !را از بین تمام گزینههای موجود انتخاب کند برابر
است پا: Pru, =max.,{u,;})
=Pru>u and u>u and.and u,>u,)
صفحه 24:
a ——
براى درك لزوم مدل #دمما در ابتدا به مدل #ادمم جند كزينه اى مى يردازيم.
در ابتدا وضعيت انتخاب با سه گزینه را در نظر میگیریم. اگر ما قیدی به مدل
اعمال نکنیم. آنگاه توزیع اجزا خطا با یک توزیع نرمال سه متغیره با یک ساختار
کوواریانس کلی مشخص میگردد. مانند زیر:
2
P00,
۷,2 )
PrP, Px,
hg ot Set gly که
_€; &; iE; oy.
. ji. T° i ait ۷ ی زگ v
از آننحا که احتمال اخاب با دو مقایسه نسبی به دست"میآید (یعنی و
) ما مى توانيم متغيرها را تغییر داده و ابعاد مساله را کاهش دهیم. بر
ذادن* و ماتريس كوواريانس2 در اسلاید بعد اورده
شده است. ,6 - ,26 My
صفحه 25:
00-10, 000
که ز 21000 0. احتمال اشتراک ۳ به صورت زیر نوشته میشود:
۷ 7
B= ۳ fi £0. A )ON AN,
probt due lee ” صفر و یک شکل بستهای برای انتگرال بالا وجود ندارد. به
علاوه با افزودن گزینه دیگری به مجموعه انتخاب. یک مرتبه دیگر انتگرالگیری
نيز افزوده خواهد شد. اين مساله باعث افزایش قابل توجه پیچیدگی محاسباتی
مساله میشود.
۲ برای انتگرال گیری به صورت عددی. میتوان سطح زیر منحنی را با تقسیم خط
مستقیم به تعدادی زیادی بازه کوچک. و تخمین سطح هر بازه به صورت
مستطیل, محاسبه نمود.
صفحه 26:
مدل انتخاب 7۸ چند گزینه ای
۲ هرچه تعداد مرتبههای انتگرالگیری افزايش مییابد. بار محاسبات برای تخمین
افزایش مییابد.
۲ اگر برای رسیدن به یک تخمین دقیق در یک مرحله انتگرالگیری نیاز به ۱۰۰
بازه باشد. ما برای انتگرال دو مرحلهای به ۰۰۱۰۰-۰ بازه نیاز داریم.
صفحه 27:
” هرجه تعداد گزینههای انتخابی بیشتر میشود. این رویکرد حتی برای
کامپیوترهای پیشرفته از نظر محاسباتی غیرممکن میشود.
اخيراً روشهای متفاوتی برای تخمینی از پارامترهای مدل ۳8ج به صورت
آسانتری توسعه یافتهاند. این روشها شامل ممانهای شبیهسازی شده حداکثر
مشابهت شبیهسازی شده و روشهای مار کوف چین- مونت کارلو میباشند.
متاسفانه بیشتر این روشها تقریبا جدید بوده و کمتر به عنوان روشی استاندارد
در پکیجهای آماری موجود هستند. در اغلب مدلسازان انتخاب به دنبال
تغییر فرضیات مدل #طصح برای سادهسازی مدل و کاهش محاسبات آن هستند.
53
صفحه 28:
ال
مدل #عط جند كزينهاى كزينه متداولتری نسبت به مدل Sool prob چون از
نظر محاسباتی قابل قبولتر بوده و فرم بستهای برای احتمال انتخاب ارائه
می دهد
در مورد مدل ابا چند گزینه ای دو مورد زیر باید مد نظر قرار بگیرد.
توزیع جزء خطای 8 به صورت زیر می باشد:
f(e;) =expt e,)expt expt ¢;)]
جزءهای خطا مستقل بوده و دارای توزیع یکسان هستند.
مورد ۲ منجر به انحراف مهمی از ساختار کوواریانس کلی مدل prob که در
بخش قبلی نمایش داده شد. میگردد. ما اين فرض را میکنيم چون منجر به
سادهسازی قابل توجهی میگردد: اين فرض باعث میشود که حداکثر مقدار
متغیرهای تصادفی با توزیع دو نمایی. خود دارای توزیع دونمایی باشد.
صفحه 29:
مدل انتخاب 7۸ چند گزینه ای
شکل بسته زیر برای مدل یدست خواهد آمد که بسیار مشابه ساختار اب صفر و یک
ن است که مخرج اکنون شامل جمع اجزای نمایی تمام گزینههای
ltt موجود السك (نه فقط دوتا)
060
هر 2 1
خصوصيات مدل #دمما جند كزينه اى :
استقلال كزينههاى مختلف (VID)
احتمالاً مختصرترين عبارت در مورد كاربرد بسيار مهم 110 اين است که در یک
مجموعه انتخاب دو گزینه !و ز. وارد کردن گزینه > تاثيرى بر روى نسبت
ندارد. به عبار جدید با کاستن از نسبت مشارکت انتخاب گزینههای
موجوو هن سا رگ الب مشا ن كلك: من BS
صفحه 30:
ای نز 8 &
مدل انتخاب ابا چند گزینه ای
J اطلاعات مربوط به چهار مارک 9) :© ط()۰ ۳" از طریق کارت
های شناسایی بدست می آیند.
* در هر بار مراجعه به فروشگاه که خریدی از این گروه صورت گرفته است. ما
اطلاعاتی در مورد قیمت طبقه هر محصول (قیمت هر اونس). چه محصولی به
طور خاص ارائه شده است و اينکه هر محصول در کجای تبلیغات فروشگاه
ارائه شده است. در اختیار داریم. این متغیرها به ترتیب ۳۵0,8۴
و /۴6969) نامگذاری شدهاند.
* ازاطلاعات ۵۲ خانوار برای مدل استفاده میکنیم. ما دو مدل را تعیین میکنیم:
مدلی که تنها دارای جزء جداکننده می باشند (که مدل صفر است و مبنای
ارزیابیهای ما را برای برازش تشکیل میدهد) و دیگری مدل دارای جزء
جداكننده براساس محصول و سه متغير بازاريابى: 010808 . 60901008 و
0۳ می باشند.
صفحه 31:
Sh
مدل انتخاب مما جند كزينه اى
* نتایج مدل ایا برای داده های انتخاب مایع لباسشویی
مدل تفکیکی مدل تفکیکی با متفیمهای بازاریابی
ریب حتطاى استاتدارد ضريب خطای استاندارد
wv 002 Gripe 2 00
YW «۳/۱ wisi ۳۷/۱ ۷۳۳/۰
nv. ۷/۰ agra ۳۷۳/۰ ۱۳/۰
Borice 2/۰ ۱۳/۰
wr/> ۳۹/۰ Brear
wi: Bors ۱۳۷/۰
-A/t Me -۷ LL
صفحه 32:
در نظر گرفتن ناهمگونی
* اگر خانوارهای موجود در لیست. مقادیر پارامترهای مختلفی در تابع
بیتشان داشته باشند. چه اتفاقی میافتد؟
* پیامدهای این تفاوتها را به سادگی میتوان با درک اینکه تفاوتها در ترجیح
مارکهای مختلف میتوانند در جزء جداکننده تابع مطلوبیت نمایش داده شوند.
آشکار کرد. بنابراین یک خانواده با وفاداری به یک مارک خاص. مقدار بزرگی
پرای جزء جداکننده دارد
* اگر خانوادهها در اجزای جداکننده تابع مطلوبیتشان ناهمگن باشند. آنگاه
تخمین پارامترهای مدل زمانی که به طور متوسط تخمین زده میشوند. نسبت به
مقدار واقعی انحراف خواهند داشت.
9 برای مقابله با ناهمگونی ها سه رویکرد اندازهگیری مستقیم تفاوتهای فردی.
مدلهاى كروه !و مدلهاى ضرايب تصادفى را در نظر مى كيريم.
صفحه 33:
1177ل"
اندازه گیری مستقیم تفاوت های فردی
* در این رویکرد تابع مطلوبیت را به صورت زیر تعریف می کنیم.
10۲ یش as
Up =4,+ BioyLOY' + XB +
* نتایج حاصل از در نظر گرفتن این رویکرد برای مثال قبل در جدول زیر آورده
شده است.
صفحه 34:
re!
۹ 5
Brice
B rear
P pips
Broy
LL
we
Wes
۳/۸
۷/۰
خطای استاندارد
ws
rw
۳/۰
الم
ا للا لس
مدل KS با متفيررهاى بازاريايى
ضريب خطای استاندارد
وام ۳/۰
۳۷/۹ ۳/۰
۳۷۳/۰ ۳/۰
Ws 0/۰
۳/۰ ۳۷۳/۰
wy ۳۹۷/۰
wv ۳۷۰
A/T AS
مدل تنكيكى بامتفيررهاى بازاريايى
LOY x,
we خطای
th
۳۹۹/۱ 2
mv Yot/+
۳۳/۰ ۳۹/۰
M/s ۰/-
1/۰ ۳/۰
۳/۸ ۳۳/۰
WWE ۳۹۳/۰
-
صفحه 35:
ال
Lutent «55 cb مدل
* تفاوتها بین تعداد کمی از گروهها. که در داخل خود همگن هستند. وجود
بارد. 1
Bae, زگ + و لوط + ورة - وربلا
__&xp@,+ X85)
Dx Gy, + HB.)
| نجا که ما نمیتوانیم عضویت در گروه #ا را مشاهده کنیم. ما احتمال
انتخاب هر فرد را به صورت تر کیب وزنی از احتمال انتخاب میان گروههای
مختلف تعریف میکنیم
Bi #) Ody
صفحه 36:
مدل های ضرایب تصادفی
* در این مدل فرض میشود که تفاوت میان افراد مختلف را میتوان با برخی
توزیعهای پارامتریک (نرمال چندمتغیره) توصیف نمود.
=X" ten
exp")
EXP (
Bb’ ~NB,D)
* اخيراً تعداد قابل توجهی از تحقیقات به یافتن روشهایی برای تخمین
پارامترهای مدل اختصاص داده شدهاند. برخی از موفقترین این روشها از
عبارتی به نام نمونه گیر اط) استفاده میکنند. مراحل اين الگوریتم در فصل
کتاب آورده شده است
صفحه 37:
صفحه 38:
مدل انتخاب بسا موی
* در مدل #عط جندكزينهاى. ما فرض كرديم كه اجزى خطا در تابع مطلوبيت
مستقل بوده و داراى توزيع يكسان هستند. اما مواقعى وجود دارند كه اين فرض
بیش از حد موجب سادهسازی میگردد. به عنوان مثال. زمانی که ما با گزینههای
انتخابى سروكار داريم که دارای مشابهت در تفاوتهایشان هستند.
* رها کردن کامل فرض استقلال منجر به عدم وجود حل بستهای برای احتمال
انتخاب شده و ما را با یک مشکل تخمین از نظر محاسباتی وحشتناک مواجه
ف كيد
* به جای رها کردن فرض استقلال ما میتوانیم ساختارى را به مدل تحميل كنيم كه
متناظر با الگوی شباهتهای میان گزینههای انتخابی است. یک راه انجام اين US
استفاده از مدلهای لپا لووو(ا) است .
* مدل فا لح( یک ساختار سلسله مراتبی را تحميل مى كند. اين روش
گروههایی از آیتمها را ایجاد میکند که نسبتاً از مشابهت ب apts بت بهسایز
آیتمهای موجود در گروههای دیگر برخوردار هستند.
صفحه 39:
Dested Low مدل انتخاب
* جزء خطای تابع مطلوبیت را (یعنی مشخصات غیرقابل اندازهگیری موثر بر
انتخاب) به صورت مجموع دو جزء مدل میکنیم: یکی که مربوط به هر آیتم
است (با عنوان مزبرای ایتم در گروه ع) و دیگری که مربوط به گروه است
(با عنوان ERM میکنيم که . ووزگ به لور مستقل با واریانسهای
متفاوت توزیع شدهاند.
* تفاوت واریانسها را با تفاوت در مقیاسبندی پارامترها در نظر میگیریم؛ به
عنوان مثال. زرا برای نمایش پارامتر مقیاس برای خطای مربوط به هر آیتم
MES مى بريم.
* مطلوبیت آیتم !در گروه ع به صورت زير تعريف مى شود:
Uy, =ZY + Xie t Fic ۵
* كه ص بردارى از متغيرهاى مربوط به كروه بوده و Bic متغیرهای مربوط
به هر آيتم است.
صفحه 40:
مدل انتخاب QDested Low
* احتمال انتخاب آیتم !در گروه طط.ع به صورت زیر میتواند نوشته شود:
,۳ < م۲
احتمال انتخاب آیتم !از گروه < توسط فرد. به شرط انتخاب اين كروه
است. این احتمال پرابر است با:
exp&f) جر
2XPK.B) 2
* احتمال انتخاب گروه « به صورت احتمال اینکه آیتم با بیشترین مطلوبیت در
گروه « از بیشترین مقدار مطلوبیت آیتمها در هریک از گروههای دیگر بزرگتر
باشد. میباشد. این به صورت زیر میتواند نوشته شود:
p. =Pr&y+maxk,p +¢,.]+€,> Zy+
maxk,6 +éiql+€,} forallcatjwries d
صفحه 41:
0 * از انجا که حداکر متفر مستقل دارای توزیع دونمایی نیز دارای توزیع دونمایی
است. عبارت Ec + تا صورت . . یک مظیر با توزيع
دونمایی با يارامتر موقعيت امساق اهس بير
نوشت. me Mic
* قرار دادن به چای در معادله. نتیجه میدهد:
ی ۳-۷
* حال اگر ما اکنون فرض کنیم که جز ترکیبی خطای مستقل بوده و دارای توزیع
مشابه با مبنای توزیع دو نمایی (با پارامتر مقیاس ) هستند معادله بالا میتواند به
شکل مدل الط چند گزینهای کاهش پیدا کند:
اي دب Pen >
مکی متیر ار + رتور 2 *
صفحه 42:
مدل Dested Low GL!
* با ترکیب اجزا سل و po در معادلات. میتوان احتمال غیرشرطی انتخاب آیتم ۱
از گروه »را به دست آورد:
AY + Mel tel. CXPW A) Mid), ۱
y+ Mel Mel, ey اطع بز DEXPEA)
4 هر جه نسبت Mel Mio كوجكتر شو إد نشان دهئده افزايش ميان
يغاي اتات در يك کی کته در حالت حدى. كه © به صفر
نزديك میشود. OLS دهنده اين است كه هيج ارتباطی میان گزینهها در
گروههای مختلف وجود ندارد. به عبارت دیگر. افزايش جذابیت یک گزینه در
یک گروه هیچ تاثیری بر احتمال انتخاب یک آیتم از یک گروه دیگر ندارد.
Pe =
صفحه 43:
Dested Low مدل انتخاب
اگر 2۱ ۸/۸ باشد نشان دهنده این است که عدم قطعیتی درارتباط با طبیعت
انتخاب گروه وجود ندارد و یک مدل بط چند گزینهای لععصس . برای
تمام گزینههای انتخاب موجود. خواهیم داشت.
مدل ابا لصو( را میتوان با استفاده از حداکثر مشابهت کاملا مشابه مدل
اب چند گزینهای معمولی. تخمین زد.
متاسفانه روند ابا لعح() در بسیاری از بستههای نرمافزاری آماری موجود
نمیباشد. با این وجود راهی برای استفاده از بستههای فیط چند گزینهای برای
تخمین پارامترهای مدل ابا لوو() وجود دارد. كام هاى اين روش در فصل
مدل ایا در کتاب درسی موجود می باشد.
صفحه 44:
a
Loot Os! Jas لحطیی() - مثال رستوران
اطلاعات انتخاب ۲۰۰ دانش آموز در طول يك ترم را در اختيار داريم
اطلاعات ارائه کوپنهای تخفیف توسط هر رستوران در زمان انتخاب موجود
است
فرض میکنیم که ۱) کوپن تنها در روزی که توزیع میشود معتبر است ۲) اگر
کوپنی موجود باشد. دانش آموز از آن مطلع است و بنابراین امکان دارد بر روی
انتخاب آن تاثیرگذار باشد
جدول توزیع اطلاعات انتخاب دانشآموزان میان سه گزینه رستوران فضای باز
(تحت سناریوهای مختلف تبلیغاتی) در اسلاید بعد آورده شده است
صفحه 45:
ال
مدل انتخاب Dested Logt - مثال رستوران
obs sas ew سه بزار
Pc Qs Deli وقوع PC Qs Deli
۳۳ A ۳۹ ov * * x
۳۳ 313 4 ۳۱ x x v
3 4 to ۳۹ x v x
3 ۳ ۳۸ ۳ x 7 7
0 tr 9 ۳ 7 x x
۳ 0 8 9 7 x v
۳ 34 ۱ 0 7 7 7
9 ۷ 0 1 2 2 7
صفحه 46:
ال
مدل انتخاب Dested boy - مثال رستوران
ینهای در زیر آورده شده است
ger YB glob dae چداکننده چز جداکننده و کوپن تخنین
ضريب خطای استاندارد. ضريب خطای استاندارد.
1Vo/+ ۳/۰ a ۳۳/۰ ۷۷/۰
wis 002 00 ١
ws B 008
“une ۹ 11
صفحه 47:
مدل انتخاب Dested boy - مثال رستوران
5 با در نظر كرفتن ساختار مدل #عطا له به صورت زير نتايج تعديل شده
مدل #عط ساده جند كزينه اى در اسلايد بعد آورده خواهد شد.
یس
Domestic Asian
Deli Quik Stop . Pacific Comer
صفحه 48:
ال
مدل انتخاب Dested boy - مثال رستوران
قريب خطای اتاندارد
دریک گروه
a, ۳۳/۰ ۷/۰
WA/+ 02 B
a LL
ow گروهها
rw Mav ۷
هه ۳/۰« ۹۷/۰
LL ا
کل اي
صفحه 49:
صفحه 50:
بسم اهلل الرحمن الرحیم
دانشگاه صنعتی اميرکبير
(پلي تکنيک تهران)
دانشکده مهندسي صنايع
مدل انتخاب Logit
استاد :دکتر جمال شهرابی
ارائه دهنده :اسماعیل مرادی
زمستان 1386
فهرست مطالب
مقدمه
کاربرد مدل
مدل Logitصفر و یک
مدل Logitچند گزینه ای
مدل Nested Logit
مقدمه
مقدمه
برخالف سایر روشهای ارائه شده تاکنون برای تحلیل همبستگی ،روشی که در
این فصل معرفی میشود غیرخطی است.
احتمال انتخاب به خروجیهای انتخابی گسسته که متغیر (یا متغیرهای) وابسته را
تشکیل میدهند ،نسبت داده میشوند.
از آنجا که احتمال بین صفر و یک قرار دارد ،نیاز به یک شکل تابع غیرخطی است
تا بتوان اطالعات متغیرهای مستقل پیوسته را به بازه صفر و یک تبدیل کرد.
شکل تابع مورد استفاده برای مدل احتمالی تا حد زیادی بستگی به توزیع مفروض
برای خطای شناسایی ناشی از مدل دارد.
مدل logitدارای تابعی با فرم بسته و سرراست میباشد که به سادگی با استفاده از
روشهای حداکثر مشابهت تخمین زده میشود.
کاربرد های مدل
کاربردهای مدل انتخاب Logit
مدلهای انتخاب گسسته چون مدل Logitبرای مطالعVه انواع مختلف رفتارهای
انتخابی به کار رفته اند:
انتخاب محل خرید
انتخاب محل سکونت
انتخاب شغل
انتخاب مسیر بین دو مقصد
انتخاب مارک جنس
در دو زمینه انتخاب مسیر بین دو مقصد و مارک جVنس ،مقدار قابل توجVهی تحقیق و
مدلسازی انجام شده است که در اسالیدهای بعد به آنها می پردازیم.
مواردکاربرد – انتخاب مسیر گذر
VدلسVازVیاVنVتخابگVVسسته در ارVتباط
) :Ben-Akiva and Lerman (1985م
سVVازVی
بVVا تVVحلیلسVVیستمهایحVملو نVVقل؛ تVVوسVعه فVVرآVیندهاییبVVراVیمVدل
VتخابVVکفVVرد ،خVانوادVه VیVVا
ی
شVVکسته نVVیاز سVVفر ،در سVVطح تVVحلیلرVفVتار اVن
Vت
شVVرک .
:Warner (1962) انتخاب گسسته متمرکز بر انتخاب صفر و یک
چگونگی سفر
) :Ben-Akiva (1976مVطاVلعVاتی در زVمVینه اVنVتخابچVگونVگیمVسیر رVفVتنبVVه
Vنگتن نVVمونVه
کVار بVVا اVسVتفادVه Vاز اVطVالعاتگVردآورVیشVده Vدر سVVاVل 1968واVش ،
شVامVل 1136کVارVگر بVVود کVVه اVمVکاناVنVتخابدو یVVا تVVعVداد بVVیشتریاز سVVه روVش
جVابVجایی را داVشVتند
مواردکاربرد – انتخاب مارک کاال
VالعاتسVکن
اV
) : Guadagni and Little (1983اوVلVیناVفرادVیبVVودنVد کVVه از اVط
VتخابVارVککVاVال
م
شVVده VمVوردVیبVVراVیکVاVلیبراVسVیونیVVکمVدل logitچVندگزین هاVیاVن
اVسVتفادVه VکVردنVد ؛ مVدلدر اVنVتخابگVروVه ،VشVرطVیبVVود یVVعنیآVنVها تVVنها بVVر
بVVینیاVینکه کVداVم مVارVکدر یVVکخVرید صVورVتگVرفVته از اVینگVروVه VاVنVتخاب
پVVیش
خVواVهد شVVد ،تVVاکVید کVردVند .آVنVها تVVواVنVستنداVثراVتقVیمتو تVVبلیغ را در اVنVتخاب
قVیمت و
تVVخمینزنVند و قVادر بVVه اVسVتفادVه Vاز مVدلبVVراVیتVVخمیناVالسVتیسیته ها
ب
مارVک
اVالسVتیسته cross priceبVVراVیهردو حVاVلتقVیمتتVVبلیغیو غVیرتبلیغیشVدند.
مدل انتخاب Logitصفر و يک
مدل انتخاب Logitصفر و يک
یک فردخاص را در نظر بگیرید که از یک
سوپرمارکت که دو مارک متفاوت از یک
گروه محصول (مارکهای Aو )Bرا ارائه
میکند ،خرید میکند .قیت معمول این دو
مارک Vیکسان است اما مارک Aتخفیفهای
متناوبی را ارائه میدهد و اغلب 20 ،15 ،10
و یا حتی 30سنت ارزانتر از محصول B
است (که قیمتش ثابت باقی میماند).
هدف ما ساخت مدلی در سطح فرد برای
تعیین احتمال خرید مارک Aبه صورت
تابعی از تخفیف ارائه شده توسط مارک A
می باشد
تخفیف مارک A
انتخاب مارک A
انتخاب مارک B
00/0
1
7
10/0
1
6
15/0
3
3
20/0
4
1
30/0
4
0
مدل انتخاب Logitصفر و يک
فرض های مدل:
مطلوبیتانتخاب
تابع در زمان
مطلوبیت را
هر گزینه انتخاب پیشنهادی به فرد بخشی از
بخش قطعی
کند.مطلوبیت
غیرقطیعVی
بخش
نمایش
تابع زمان tبا
از iدر
گزینه
مطلوبیت تامین شده توسط
فراهم م
مطلوبیتuitکه ما
(بخشی
شود.مطلوبیت
تجمعی
(اثرات
داده می
به عنوان مدلکننده قادر به
فاکتورهای
ناشی از
بیشترینآن با
گزینهها ،فرد گزینه با تعیین
اطالعاتیکند.
توجه رابه انتخاب م
مطلوبیت
انتخاب بین
در
متعدد
موجود
هستیم)میکند در
خودانتخاب
یک را
غیرمشاهدهدوای)گزینه وجود دارد ،فرد گزینه
زمانی که تنها
صورتیکه ،u1t> u2tدر غیر این صورت فرد گزینه دوم را انتخاب
خواهد کرد.
به دلیل غیرمنطقی بودن فرض دسترسی ما به عنوان مدلکننده به تمام
it
تعیین تابعit
اطالعات مورد نیاز برای it
مطلوبیت هر فرد ،ما تابع مطلوبیت uitرا
به دو جز میشکنیم :
U =v +
مدل انتخاب Logitصفر و يک
بخش قطعی vitرا به صورت ترکیب خطی از متغیرهای مستقل مدل میکنیم.
vit xit
از انجا که ما مقدار itرا مشاهده نمیکنیم uit ،را نمیشناسیم و نمیتوانیم با قطعیت
بگوییم که فرد کدام گزینه را انتخاب خواهد کرد.
برداری از مشخصات اندازه گیری شده
آیتمیi
که:در زمان
میدانیم که فرد گزینه 1را در برابر گزینه 2است که
انتخابزمان
مستقیما کرد تا
انتخاب خواهد
.tرا تحت تاثیر قرار می دهد
x
x
u u
1t
1t
2t 2t
2t
1t
( 2 t 1t ) (x1t x2 t )
تاما چهمقدارحد است( 2t 1t ) .
را نمیدانیم با این وجود اگر تابع توزیع مربوط به متغیر تصادفی را بدانیم حداقل میتوانیم بگوییم که احتمال برقراری نامساوی
مدل انتخاب Logitصفر و يک
فرض کنید ) f ( 2t 1tنشان دهنده تابع چگالی احتمال باشد در این صورت
خواهیم داشت:
) f ( 2t 1t )( 2t 1t ) F((x1t x2t )
( x1t x2 t )
P1t
مقدار این احتمال به صورت گرافیکی عبارت است از:
) f ( 2 t 1t
p
) ( 2t 1t
) (x1 x2
مدل انتخاب Logitصفر و يک
اگر فرض کنیم که ) ( 2t 1tدارای تابع چگالی توزیع نرمال باشد ،مدل
احتمالی حاصل به عنوان مدل probitشناخته میشود.
از آنجا که توزیع نرمال تجمعی دارای شکل بسته نمیباشد ،شکل تابع بستهای
برای احتمال انتخاب وجود ندارد .با این که این مساله غیر قابل حل نیست،
مواقعی وجود دارد که بهتر است احVتمال انتخاب را به صورت تابعی از متغیرهای
مستقل نمایش داد.
به عنوان یک گزینه دیگر ،اگر ) ( 2 t 1t
دارای تابع توزیع زیر باشد ،مدل
حاصل Logitمیباشد.
]) exp[ ( 2t 1t
f ( 2t 1t )
2
)]) (1 exp[ ( 2t 1t
مدل انتخاب Logitصفر و يک
فایده حقیقی استفاده از توزیع Logitاین است که منجر به شکل بستهای برای
توصیف احتمال میگردد .زیرا:
]) exp[ ( 2t 1t
1
( 2t 1t )
2
) 1 exp( (x1t x2t )
)]) (1 exp[ ( 2t 1t
( x1t x2 t )
P1t
) exp(x1t
P1t
) exp(x1t ) exp(x2 t
اگر عبارت
( expبه عنوان جذابیت گزینه iدر نظر بگیریم ،احتمال انتخاب گزینه
) xitرا
1با درصد مشارکت گزینه یک در مجموع جذابیت گزینه یک و دو تعیین میگردد.
مدل انتخاب Logitصفر و يک
مقادیر پارامترهای تابع مطلوبیت مدل Logitبه سادگی با استفاده از حداکثر
مشابهت تخمین زده میشوند .در حداکثر مشابهت هدف ما این است که
پارامترهای مدل (بردار ضرایب )را به نحوی انتخاب کنیم که احتمال
اشتراک یا شباهت مشاهده خروجیهای مدل را حداکثر کنیم .اگر فرض کنیم
که مشاهدات از یکدیگر مستقل هستند ،این شباهت با ضرب احتماالت کلیه
فرصتهای انتخاب به دست میآید .راه سادهایی برای نوشتن این رابطه به
صورت زیر می باشد.
) (1 Yt
Yt
1t
) L t P (1 P1t
از روشهای عددی بهینهسازی ،برای انتخاب مقادیری از بتا که عبارت باال را
حداکثر میکنند ،استفاده میشود.
مدل انتخاب Logitصفر و يک
روش حداکثرمشابهت برای مثال قبل
vAt aA DAt
vBt aB
β
24/0
22/0
20/0
18/0
16/0
-6349/13
-5981/13
-9577/13
-7675/14
-0854/16
--4/3
-7875/13
-5266/13
-6341/13
-1924/14
-2349/15
-2/3
-1005/14
-6625/13
-5011/13
-7926/13
-5592/14
-0/3
-5734/14
-8871/13
-5350/13
-5736/13
-0661/14
-8/2
-2051/15
-3209/14
-7471/13
-5397/13
-7626/13
-6/2
aA
مدل انتخاب Logitصفر و يک
خصوصیات مدل Logit
معنیداری مدل :مقادیر حداکثر مشابهت برای دو مدل کامل و محدود شده
LLR LL
(برخی پارامترها برابر صفر قرار داده شده اند) را بدست آورده و با Fو
) 2(LLR LLF
که یک آماره
نمایش میدهیم .آماره آزمون برابر است با
کای با درجVه آزادی برابر با تعداد پارامترهایی که در مدل محدود شده برابر با
صفر قرار داده شدهاند؛ می باشد.
2
نیکویی برازش
اشاره کنیم
می توانیم به معیارهای AICو SCو شاخص
مدل انتخاب Logitصفر و يک – مثال کتاب با
پست
کتاب با پست برای معرفی کتابی ،به 1000مشتری که به طور تصادفی انتخاب
شدهاند ،یک نامه آزمایشی را می فرستد.
با استفاده از رفتار خرید گذشته مشتریان ( تعداد ماههای تا آخرین خرید و تعداد
کتابهای خریداری شده) برای تخمین مدل انتخاب صفر و یک (که دو گزینه
انتخاب ،خریدن و نخریدن هستند) استفاده میکنیم .
برای تعیین مدل ،جزء قطعی تابع مطلوبیت خرید نکردن را برابر صفر قرار
میدهیم (یعVنی .)v2 c 0جزء قطعی تابع مطلوبیت خرید کتاب عبارت است
ازv1c a 1 x1c 2 x2 c :
که x1cتعداد ماههای تا آخرین خرید مشتری c
از موسسه کتاب با پست و x2cتعداد کتابهای خریداری شده از موسسه
توسط مشتری cاست.
مدل انتخاب Logitصفر و يک – مثال کتاب با
پست
2
با توجه به 0 / 12مدل تنها 12درصد از عدم قطعیت را پوشش داده است که مقدار
بسیار کمی می باشد فلذا با استفاده از استراتژی زیر معنی داری کاربردی مدل را مورد بررسی
قرار میدهیم.
1
pc
7
(6$)pc ( 1$)(1 pc ) 0 or
نفرستادن نامه
فرستادن نامه
نخریدن
829
90
خریدن
43
38
مدل انتخاب Logitچند گزينه ای
مدل انتخاب Logitچند گزينه ای
فرض های مدل
فرد از میان تمام گزینههای موجود ،گزینهای را که دارای بیشترین مطلوبیت
است ،انتخاب میکند که این یعنی:
Choose
i C suchthat
} ui maxjC {uj
مطلوبیت هر گزینه ،که برای هر فرد مشخص است ،معVلوم نبوده و نمیتواند
دقیق ًا توسط مدلساز تعیین گردد.
مانند مدل صفر و یک مطلوبیت را به دوجزء قطعی و غیر قطعی تقسیم می
کنیم.
احتمال اینکه یک فرد گزینه iرا از بین تمام گزینههای موجود انتخاب کند برابر
است با:
)} Pr(ui maxjC {uj
) ui uj
and...and
ui u2
and
Pr(ui u1
مدل انتخاب Logitچند گزينه ای
برای درک لزوم مدل Logitدر ابتدا به مدل probitچند گزینه ای می پردازیم.
در ابتدا وضعیت انتخاب با سه گزینه را در نظر میگیریم .اگر ما قیدی به مدل
اعمال نکنیم ،آنگاه توزیع اجزا خطا با یک توزیع نرمال سه متغیره با یک ساختار
کوواریانس کلی مشخص میگردد ،مانند زیر:
که
12
12 1 2 13 1 3
12 1 2 22
23 2 3
13 1 3 23 2 3 32
i2
واریانس
و
همبستگی بین
ij
i
) ~N(0,
و
i
است.
j
و
از آنجا که احتمال انتخاب با دو مقایسه نسبی به دست میآید (یعنی
قرار
) ما می
با2
توانیم متغیرها را تغییر داده و ابعاد مساله را کاهش دهیم1 .
دادن
3 1
در اسالید بعد آورده
ماتریس کوواریانس
و
31 3 1
شده است 21 2 1 .
مدل انتخاب Logitچند گزينه ای
12 22 2 12 12 12 13 23
2
2
2
2
1 12 13 23 1 3 13
که . ij pij i jاحتمال اشتراک p1به صورت زیر نوشته میشود:
f ( 21 , 31 ) 21 31
v1 v3
v1 v2
p1
همانند مدل probitصفر و یک شکل بستهای برای انتگرال باال وجود ندارد .به
عالوه با افزودن گزینه دیگری به مجموعه انتخاب ،یک مرتبه دیگر انتگرالگیری
نیز افزوده خواهد شد .این مساله باعث افزایش قابل توجه پیچیدگی محاسباتی
مساله میشود.
برای انتگرالگیری به صورت عددی ،میتوان سطح زیر منحنی را با تقسیم خط
مستقیم به تعدادی زیادی بازه کوچک ،و تخمین سطح هر بازه به صورت
مستطیل ،محاسبه نمود.
مدل انتخاب Logitچند گزينه ای
هرچه تعداد مرتبههای انتگرالگیری افزایش مییابد ،بار محاسبات برای تخمین
افزایش مییابد.
اگر برای رسیدن به یک تخمین دقیق در یک مرحله انتگرالگیری نیاز به 100
بازه باشد ،ما برای انتگرال دو مرحلهای به 100×100=10000بازه نیاز داریم.
مدل انتخاب Logitچند گزينه ای
هرچه تعداد گزینههای انتخابی بیشتر میشود ،این رویکرد حتی برای
کامپیوترهای پیشرفته از نظر محاسباتی غیرممکن میشود.
اخیراً روشهای متفاوتی برای تخمینی از پارامترهای مدل probitبه صورت
آسانتری توسعه یافتهاند .این روشها شامل ممانهای شبیهسازی شده ،حداکثر
مشابهت شبیهسازی شده و روشهای مارکوف چین -مونتکارلو میباشند.
متاسفانه بیشتر این روشها تقریب ًا جدید بوده و کمتر به عنوان روشی استاندارد
در پکیجهای آماری موجود هستند .در نتیجه اغلب مدلسازان انتخاب به دنبال
تغییر فرضیات مدل probitبرای سادهسازی مدل و کاهش محاسبات آن هستند.
مدل انتخاب Logitچند گزينه ای
.1
مدل logitچندگزینهای گزینه متداولتری نسبت به مدل probitاست چون از
نظر محاسباتی قابل قبولتر بوده و فرم بستهای برای احتمال انتخاب ارائه
میدهد.
در مورد مدل Logitچند گزینه ای دو مورد زیر باید مد نظر قرار بگیرد.
توزیع جزء خطای iبه صورت زیر می باشد:
]) f ( i ) exp( i ) exp[ exp( i
.2
جزءهای خطا مستقل بوده و دارای توزیع یکسان هستند.
مورد 2منجر به انحراف مهمی از ساختار کوواریانس کلی مدل probitکه در
بخش قبلی نمایش داده شد ،میگردد .ما این فرض را میکنیم چون منجر به
سادهسازی قابل توجهی میگردد :این فرض باعث میشود که حداکثر مقدار
متغیرهای تصادفی با توزیع دو نمایی ،خود دارای توزیع دونمایی باشد.
مدل انتخاب Logitچند گزينه ای
شکل بسته زیر برای مدل یدست خواهد آمد که بسیار مشابه ساختار logitصفر و یک
است .تنها تفاوت این است که مخرج اکنون شامل جمع اجزای نمایی تمام گزینههای
انتخابی موجود است (نه فقط دوتا).
) exp(vi
pi
) k exp(vk
خصوصیات مدل Logitچند گزینه ای :
استقالل گزینههای مختلف ()IIA
احتماالً مختصرترین عبارت در مورد کاربرد بسیار مهم IIAاین است که در یک
مجموعه انتخاب دارای دو گزینه iو ، jوارد کردن گزینه kتاثیری بر روی نسبت
ندارد .به عبارت دیگر ،گزینه جدید با کاستن از نسبت مشارکت انتخاب گزینههای
موجود در i / j
مجموعه ،در انتخاب مشارکت میکند.
مدل انتخاب Logitچند گزينه ای
اطالعات مربوط به چهار مارک Tide ، Wisk ،Era ،Surfاز طریق کارت
های شناسایی بدست می آیند.
در هر بار مراجعه به فروشگاه که خریدی از این گروه صورت گرفته است ،ما
اطالعاتی در مورد قیمت طبقه هر محصول (قیمت هر اونس) ،چه محصولی به
طور خاص ارائه شده است و اینکه هر محصول در کجای تبلیغات فروشگاه
ارائه شده است ،در اختیار داریم .این متغیرها به ترتیب PRICE، DISP
و FEATنامگذاریشدهاند.
ازاطالعات 52خانوار برای مدل استفاده میکنیم .ما دو مدل را تعیین میکنیم:
مدلی که تنها دارای جزء جداکننده می باشند (که مدل صفر است و مبنای
ارزیابیهای ما را برای برازش تشکیل میدهد) و دیگری مدل دارای جزء
جVداکننده براساس محصول و سه متغیر بازاریابی PRICE، DISP :و
FEATمی باشند.
مدل انتخاب Logitچند گزينه ای
نتایج مدل Logitبرای داده های انتخاب مایع لباسشویی
مدل تفکیکی با متغیرهای بازاریابی
مدل تفکیکی
ضریب
خطای استاندارد
ضریب
خطای استاندارد
635/0
186/0
875/0
208/0
403/1
168/0
107/1
180/0
-047/0
216/0
372/0
234/0
PRICE
-508/0
111/0
FEAT
639/0
273/0
DIPS
681/0
229/0
aTIDE
aWISk
aERA
LL
-8/417
-8/380
در نظر گرفتن ناهمگونی
اگر خانوارهای موجود در لیست ،مقادیر پارامترهای مختلفی در تابع
مطلوبیتشان داشته باشند ،چه اتفاقی میافتد؟
پیامدهای این تفاوتها را به سادگی میتوان با درک اینکه تفاوتها در ترجیح
مارکهای مختلف میتوانند در جزء جداکننده تابع مطلوبیت نمایش داده شوند،
آشکار کرد .بنابراین یک خانواده با وفاداری به یک مارک خاص ،مقدار بزرگی
برای جزء جداکننده دارد
اگر خانوادهها در اجزای جداکننده تابع مطلوبیتشان ناهمگن باشند ،آنگاه
تخمین پارامترهای مدل زمانیکه به طور متوسط تخمین زده میشوند ،نسبت به
مقدار واقعی انحراف خواهند داشت.
برای مقابله با ناهمگونی ها سه رویکرد اندازهگیری مستقیم تفاوتهای فردی،
مدلهای گروه latentو مدلهای ضرایب تصادفی را در نظر می گیریم.
اندازه گیری مستقیم تفاوت های فردی
در این رویکرد تابع مطلوبیت را به صورت زیر تعریف می کنیم.
h
y
it it
nh
LOYi h
uith ai LOYLOYi h xit ith
نتایج حاصل از در نظر گرفتن این رویکرد برای مثال قبل در جدول زیر آورده
شده است.
مدل تفکیکی
مدل تفکیکی با متغیرهای بازاریابی
مدل تفکیکی با متغی/رهای بازاریابی
و متغیر LOY
ضریب
خطای استاندارد
ضریب
خطای استاندارد
ضریب
خطای
استاندا
رد
aTIDE
635/0
186/0
875/0
208/0
394/1
308/0
aWISk
403/1
168/0
107/1
180/0
254/0
266/0
aERA
-047/0
216/0
372/0
234/0
363/0
319/0
PRICE
-508/0
111/0
-640/0
-165/0
FEAT
639/0
273/0
990/0
360/0
DIPS
681/0
229/0
143/1
321/0
LOY
681/0
229/0
009/4
293/0
LL
-8/417
-8/380
-2/186
مدل های گروه Latent
تفاوتها بین تعداد کمی از گروهها ،که در داخل خود همگن هستند ،وجود
دارد.
uit|s ai|s xit s it|s
) exp(ai|s xit s
Pit|s
) k exp(ak|s xkt s
از آنجا که ما نمیتوانیم عضویت در گروه Latentرا مشاهده کنیم ،ما احتمال
انتخاب هر فرد را به صورت ترکیب وزنی از احتمال انتخاب میان گروههای
مختلف تعریف میکنیم
pith s pit|s
s
مدل های ضرایب تصادفی
در این مدل فرض میشود که تفاوت میان افراد مختلف را میتوان با برخی
توزیعهای پارامتریک (نرمال چندمتغیره) توصیف نمود.
uith xit h ith
) exp(xit h
P
) k exp(xkt h
h
it
) h ~N( , D
اخیراً تعداد قابل توجهی از تحقیقات به یافتن روشهایی برای تخمین
پارامترهای مدل اختصاص داده شدهاند .برخی از موفقترین این روشها از
عبارتی به نام نمونهگیر Gibbsاستفاده میکنند .مراحل این الگوریتم در فصل
کتاب آورده شده است
Nested Logit مدل انتخاب
مدل انتخاب Nested Logit
در مدل logitچندگزینهای ،ما فرض کردیم که اجزی خطا در تابع مطلوبیت
مستقل بوده و دارای توزیع یکسان هستند .اما مواقعی وجود دارند که این فرض
بیش از حد موجب سادهسازی میگردد ،به عنوان مثال ،زمانیکه ما با گزینههای
انتخابی سروکار داریم که دارای مشابهت در تفاوتهایشان هستند.
رها کردن کامل فرض استقالل منجر به عدم وجود حل بستهای برای احتمال
انتخاب شده و ما را با یک مشکل تخمین از نظر محاسباتی وحشتناک مواجه
میکند.
به جای رها کردن فرض استقالل ما میتوانیم ساختاری را به مدل تحمیل کنیم که
متناظر با الگوی شباهتهای میان گزینههای انتخابی است .یک راه انجام این کار
استفاده از مدلهای Nested Logitاست .
مدل Nested Logitیک ساختار سلسله مراتبی را تحمیل میکند .این روش
گروههایی از آیتمها را ایجاد میکند که نسبت ًا از مشابهت بیشتری نسبت به سایر
آیتمهای موجود در گروههای دیگر برخوردار هستند.
مدل انتخاب Nested Logit
جزء خطای تابع مطلوبیت را (یعنی مشخصات غیرقابل اندازهگیری موثر بر
انتخاب) به صورت مجموع دو جزء مدل میکنیم :یکی که مربوط به هر آیتم
است (با عنوان icبرای آیتم iدر گروه )cو دیگری که مربوط به گروه است
فرض میکنیم که و icبه c
(با عنوان ) c .
طور مستقل با واریانسهای
متفاوت توزیع شدهاند.
تفاوت واریانسها را با تفاوت در مقیاسبندی پارامترها در نظر میگیریم؛ به
عنوان مثال ic ،را برای نمایش پارامتر مقیاس برای خطای مربوط به هر آیتم
کار میبریم.
به ic
مطلوبیت آیتم iدر گروه cبه صورت زیر تعریف می شود:
ic c
uic zc xic
که zcبرداری از متغیرهای مربوط به گروه بوده و
به هر آیتم است.
xicبردار متغیرهای مربوط
مدل انتخاب Nested Logit
احتمال انتخاب آیتم iدر گروه ،c، picبه صورت زیر میتواند نوشته شود:
pic pi|c pc
pi|cاحتمال انتخاب آیتم iاز گروه cتوسط فرد ،به شرط انتخاب این گروه
است .این احتمال برابر است با:
)
exp(xic
Pi|c
) k exp(xkc
احتمال انتخاب گروه cبه صورت احتمال اینکه آیتم با بیشترین مطلوبیت در
گروه cاز بیشترین مقدار مطلوبیت آیتمها در هریک از گروههای دیگر بزرگتر
باشد ،میباشد .این به صورت زیر میتواند نوشته شود:
pc Pr{zc max[xic ic ] c zd
id ] d } forallcate
max[xid
gories
d
مدل انتخاب Nested Logit
از انجا که حداکثر متغیر مستقل دارای توزیع دونمایی نیز دارای توزیع دونمایی
،یک c
متغیر با توزیع
[maxبه صورت
] ic icمxیتواند
است ،عبارت
مقیاس1
،
] xjc ) icو
دونمایی با پارامتر موقعیت
پارامتر[ln
(exp
j
ic
ic
نوشت.
قرار دادن به جVای در معادله ،نتیجه میدهد:
حال اگر ما اکنون فرض کنیم که جVز ترکیبی خطای مستقل بوده و دارای توزیع
مشابه با مبنای توزیع دو نمایی (با پارامتر مقیاس ) هستند معادله باال میتواند به
شکل مدل logitچندگزینهای کاهش پیدا کند:
pc Pr{zc c c zd c d }forallcate
gories
d
) exp( c zc c / ic ln jc exp(xjc ) ic
)d exp( c zd c / ic ln j d exp(xjd )ic
pc
مدل انتخاب Nested Logit
با ترکیب اجزا pi|cو pcدر معادالت ،میتوان احتمال غیرشرطی انتخاب آیتم i
از گروه cرا به دست آورد:
) exp( c zc c / ic ln jc exp(xjc ) ic
) exp(xic
pic
) k exp(xkc ) d exp( c zd c / ic ln jd exp(xjd )ic
هر چه نسبت c / icکوچکتر شود نشان دهنده افزایش همبستگی میان
گزینههای انتخاب در یک گروه است .در حالت حVدی ،که c / icبه صفر
نزدیک میشود ،نشان دهنده این است که هیچ ارتباطی میان گزینهها در
گروههای مختلف وجود ندارد .به عبارت دیگر ،افزایش جذابیت یک گزینه در
یک گروه هیچ تاثیری بر احتمال انتخاب یک آیتم از یک گروه دیگر ندارد.
مدل انتخاب Nested Logit
اگر c / ic 1باشد نشان دهنده این است که عدم قطعیتی درارتباط با طبیعت
انتخاب گروه وجود ندارد و یک مدل logitچندگزینهای ، non-nestedبرای
تمام گزینههای انتخاب موجود ،خواهیم داشت.
مدل Nested Logitرا میتوان با استفاده از حداکثر مشابهت کام ً
ال مشابه مدل
logitچندگزینهای معمولی ،تخمین زد.
متاسفانه روند Nested Logitدر بسیاری از بستههای نرمافزاری آماری موجود
نمیباشد .با این وجود راهی برای استفاده از بستههای logitچندگزینهای برای
تخمین پارامترهای مدل Nested Logitوجود دارد .گامهای این روش در فصل
مدل Logitدر کتاب درسی موجود می باشد.
مدل انتخاب – Nested Logitمثال رستوران
اطالعات انتخاب 200دانش آموز در طول یک ترم را در اختیار داریم
اطالعات ارائه کوپنهای تخفیف توسط هر رستوران در زمان انتخاب موجود
است
فرض میکنیم که )1کوپن تنها در روزی که توزیع میشود معتبر است )2اگر
کوپنی موجود باشد ،دانشآموز از آن مطلع است و بنابراین امکان دارد بر روی
انتخاب آن تاثیرگذار باشد
جدول توزیع اطالعات انتخاب دانشآموزان میان سه گزینه رستوران فضای باز
(تحت سناریوهای مختلف تبلیغاتی) در اسالید بعد آورده شده است
مدل انتخاب – Nested Logitمثال رستوران
سناریوی تبلیغاتی
سهم بازار
تعداد دفعات
وقوع
Deli
QS
PC
×
×
×
57
39
28
33
×
×
31
48
19
32
×
×
36
25
56
19
×
16
38
31
31
×
×
30
43
33
23
×
13
46
23
31
×
11
0
64
36
6
33
17
50
Deli
QS
PC
مدل انتخاب – Nested Logitمثال رستوران
نتایج مدل Logitساده چندگزینهای در زیر آورده شده است
مدل دارای تنها جز جداکننده
جز جداکننده و کوپن تخفیف
ضریب
خطای استاندارد
ضریب
خطای استاندارد
a1
213/0
175/0
203/0
177/0
a2
142/0
178/0
122/0
180/0
479/0
180/0
β
LL
-0/219
-4/215
مدل انتخاب – Nested Logitمثال رستوران
با در نظر گرفتن ساختار مدل nested logitبه صورت زیر نتایج تعدیل شده
مدل logitساده چند گزینه ای در اسالید بعد آورده خواهد شد.
Asian
Pacific Corner
Domestic
Quik Stop
Deli
مدل انتخاب – Nested Logitمثال رستوران
خطای استاندارد
ضریب
در یک گروه
a1
122/0
178/0
β
995/0
278/0
LL
-4/90
بین گروهها
γ1
881/0
268/0
φ
-012/0
257/0
LL
-3/121
LLک//ل
-7/211
؟
با تشکر از توجه شما