صفحه 1:
Regression Analysis C3 gaat Sag LT ارائه دهن دكان آفرين نوايزدان ارمان تيمورى

صفحه 2:
معد مه پیش نیاز بسیاری از مباحث بعدی * پرکاربردترین شکل آنالیز وابستگی ها * روابط بین مجموعه ای از متغیرهای مستقل و یک متغیر وابسته v برای پاسح به 7 اب ey

صفحه 3:
مثال قد و وزن * رابطه رگرسیون کامل و دقیق نیست * متغیرهای غیر قابل شناسایی ‎i‏ سس رن یا غیر قابل اندازه گیری | : * مثال قد و وزن ۲۰ زن * ۲ زن با قد یکسان؛ وزن یکسان ندارند یعنی: | ‎(nes‏ ‏قد تنها فاکتور تأثی رگذار روی ۴ ‎ae”‏ وزن سس

صفحه 4:
مثال قد و وزن * اگر هیچ اطلاعی از قد نداشته باشیم * میانگین وزنها ‎ra‏ تب 0] رنج تغییرات وزنها: ‎٩۳‏ تا ۱۵۵ ۰ یعنی خطای حدود ۲۰ واحد ‎cre‏

صفحه 5:
* با داشتن کمی اطلاعات در مورد قد [ . . ۱ acl. © ۲ دسته | کمتر از میانه: ‎٩۳‏ ۱۳۶۱ بيشتر از میانه: ۱۱۷ تا ۱۵۵ یعنی خطای ۲۰ واحد * بازه کوچکتر قد باعث بهبود تخمین , می شود. اما بازه بسیار کوچک باعث

صفحه 6:
مثال قد و وزن * رگرسیون ساده سس وور (یک متغیر مستقل و یک متغیر وابسته) | ‎Y=h+hx‏ ۱ * انتخاب ضرایب و9 و و0 برای پیش بینی واقعی تر و تخمین بهتر وزن 5-52 1 By=#/+4 5 Do=-1er/a ° * برای یک قد خاص مقدار خطا ۱۰ واحد است

صفحه 7:
مفاهیم * هدف از انجام رگرسیون: تعیین خطی با دقیقترین مقدار برازش و کمترین مقدار خطا * تعیین دقت: 4 اا ‎FY” 7‏ ارط

صفحه 8:
مفاهیم * اختلاف بین عدم اطمینان با استفاده از میانگین و مقادیر برازش شده - عدم اطمينان كاهش يافته توسط مدل ركرسيون

صفحه 9:
مفاهیم * نسبت اختلاف عدم اطمینان ها به عدم اطمینان واقعی با ‎Sy HP‏ رز دار 2 2 نيد ل يي د نشان داده مى شود. * برای مثال قد و وزن20/75 18 یعنی 10/87 * وابستگی بین مقادیر برازش شده و مقادیر واقعی ۰/۸۷ است. * با استفاده از اطلاعات قد» ۷۰/ از تغییرات وزن را می توان توصیف هه

صفحه 10:
مثال کارتهای اعتباری * ۳ متغیر مستقل (تعداد اعضای خانواده» درآمد» تعداد اتومبیلها) تعداه درآمد تعداد كارتهاى | أتوه و + اعتباري ‎t‏ ۱ 1 ۲ 1 ۲ ۳ ۲ 3 ۳ ‘ 14 ۲ ١ ‘ £ "۷ ۱ ۲ ۰ ۰ vA ۳ ۸ 1 ۰ 1 ۲ ۲ ۷ 1 Ww ۱ ۸

صفحه 11:
مثال کارتهای اعتباری اگر هیچ اطلاعی از متغیرها نداشته باشیم میانگین تعداد کارتها < ۷ مجموع مربعات خطا -۲۲ واحد رگرسیون ساده (به کمک متغیر تعداد اعضای خانواده) این متغیر بیشترین ضریب همبستگی را دارد مدل دگرسیون ‏ 171+ (1< به کمک کمترین مجموع مربعات خطاه ۸۰1 برابر ۰/۹۷۲ و ۲/۸۷ است

صفحه 12:
7 +7287 یعنی به ازای هر عضو اضافی در خانواده میانگین موجودی کارت اعتباری خانواده ۰/۹۷ افزایش دارد. مجموع مربعات خطا - ۵/۵ _ 22-55 در اين حالت: 075- رگ نز ‎Bowes‏ چند گانه (به کمک تعداد اعضا و درآمد خانواده) مدل رگرسیون ‏ ۲ب +جط + لديز با محاسيه | 117 217 + ۷ 063 +0482-< 17 مقدار خطا - ۳/۰6 در اين حالت: 20.86 18 با اضافه كردن متغير سوم» داريم: 7-087 كه نسبت به ‎١‏ حالت قبل» افزایش کمی دیده می شود پس بهتر است از ۲ متغیر استفاده شود.

صفحه 13:
مفاهیم * حالت تعمیم یافته مدل رگرسیون قرط +... + رايط + ‎AY, |X Xr Xp) =B + BX,‏ * که عدم اطمینان عبارتست از جع + .۰ ,ید ریک | ما ۳ < نز ۱ * و شکل ماتریسی آن 7 تریسی ان ‎Y=Xbee‏

صفحه 14:
gots ‏فرضیات مدل‎ * ‏اقا ات گام‎ | sl > 7" ‏:ها دارای توزیع یکسان و مستقل با میانگین صفر و واریانس‎ ‏هستنك.‎ دقیقترین مقدار برازش شده دارای بالاترین ** است.

صفحه 15:
‎oe esi‏ سل * تخمین قیمت زمینی به مساحت ۲6۷/۸ جریب» هم سطح با دریا * از زمینهای اطراف تعداد کمی فروخته شده بود و هیچکدام شبیه اين ‎eon‏ ‏* برای طراحی مدل رگرسیون 0 تعیین فاکتورهای موثر بر قیمت زمین (مساحت» تاریخ فروش؛ ارتفاع از سطح دریاء موقعیت» دسترسی به فاضلاب) ‏0 جمع آوری داده های مربوط به ۳۱ زمین اطراف که در ۱۰ سال فروخته شده بودند

صفحه 16:
مثال تخمین قیمت زمین لسلی * تبدیل قیمتها به قیمت در واحد مساحت * رسم نمودار قیمت در برابر تعداد زمینها ‎١‏ ره ۳ | نقض بعضی از فرضیات مدل | * تبدیل قیمت به لگاریتم قیمت | eg( PRICE)

صفحه 17:
مثال تخمین قیمت زمین لسلی تعیین متغیرهای موثر بر قیمت به کمک ماتریس همبستگی نمونه انام ‎a‏ ‏کت 33 ‎PRICE‏ همم ی . همین مله ‎o‏ ‎SIZE‏ صمه هواه همه © هه ‎ELEVATION‏ موی عجرن ‎WOO DIED‏ 9 98 6 ‎O18 OS OKO SEWER‏ دمرس ‎WOOO‏ ‏مه © 9 ‎DATE‏ موه واه ‎WIA‏ مومه مض ‎Ss © 3‏ 0 ‎FLOOD‏ هی همه هی هعجاف اه ‎WOO OO‏ ¥ 2 و 9 ‎o‏ ‎WOOD OK OF ONE ‏فقصاه‎ O19 OP MDE _ DISTANCE ‏هه‎ © z ‏م‎ 2 @ ‎ ‎ ‎ ‎ ‎

صفحه 18:
ثال تخمین قیمت زمین لسلی * استفاده از نمودار پراکندگی داده ها برای ارزیابی متغیرها ‎v‏ ‏میزان وابستگی ها ‎i) LC‏ ۱ که توسط ضریب همبستگی؛ . ۳ قابل ارزیایی نیستند.

صفحه 19:
مثال تخمین قیمت زمین لسلی * مدل رگرسیون ‎h( Elevation b,| Datb+ bj Flood+ b,\ Distance + ¢‏ + جع 106۳۲6۵ * جدول خطای استاندارد که از مانریس خطای بدست آمده است. ۳۳۳۳۳۳۳۲۳۳ ۳ Wistance ps. yi ‏معنى دار‎ * 0996 9 ۲۵ t OOPS ۹ ۵۵ foe 0/0002 (۵ ۴ 0۵/090 ۰ ۰ 40/9969 ۷0۵ (۱ ۱ 3 POM% R?

صفحه 20:
* همبستگی مثبت بین 6۱6۷۵110۳ و (109)0۲166 * همبستگی منفی بین 1000 و ‎log(price)‏ ‏۴ 050066 با 6۱6۷۵10۳0 همبستگی‌منفی‌داردلما با 1000 همبستگی مثبه‌ارد. ات ‎AS‏ PRICE: county Se eLevarion ‘sewer bate Loop oon owe ۳ ۵ هه 1 وميه 9 هن = woo on one oe 0 ore 0 ‏ما۵‎ ‏د‎ ‎ore iow ‏ممه‎ ‎ome ‏مره‎ هن op? مين ممم ower 019 pee a dono “nie “nu once aww o 0 ۳ سما 6 له ‎Woon OF OD‏ م ‎aa‏

صفحه 21:
* از مزایای رگرسیون چند گانه 07 بررسی همزمان متغیرهاه به وابستگی های درونی پی می بریم. Distance yy Fe ese * 07 ثابت نگه داشتن اثرات 1000 و 66۷31011 انتظار داریم که با یک مایل نزدیک شدن به منطقه مرتفع ترء (ع00)0110/ به اندازه ۷ افزایش یابد که برابر1/06- 0777 برای هر جريب است.

صفحه 22:
مدل چقدر خوب برازش شده است؟ * * بالاتر یعنی برازش بهتر و دقت بیشتر * برای متا ۱ 1- جر ل ار برا مسائل ا بین ۰/۱ و ۰/۰ است. * برای سری های زمانی»** بسیار بالا حدود ۰/۹۰ است. ۶ مدا با اضافه شدن یک متغیر مستقل جدید» همیشه * افزایش می یابد.

صفحه 23:
مدل چقدر خوب برازش شده است؟ هدف در ساخت مدل رگرسیون انتخاب تعداد مناسب متغیر مستقل و افزايش دقت برازش است. استفاده ‎lm pd Ri gle 4 Rij‏ یز - زرا لله ال يقلات فر ضعف را ندارد. ۲-1 7 -زرا برای مثال 8 7 0

صفحه 24:
* تصادفی نبودن ضرایب مدل رگرسیون * معنی دار بودن همه متغیرها * فرضی که برای:*ها در نظر می گیریم < همه" ها مستقل و دارای توزیع نرمال با میانگین صفر و واییانس مشانه*0 « و ر ۶-۸0 شا ها ۱۳ | مد نسبت ‎ia. o‏ نيم که آزمون ز نسبت خطای محاسبه شده استفاده می کنیم * برای آزمون مدل» از نسب ى رو داراى توزيع ۳ است. الف اماد ۳

صفحه 25:
* استفاده از جدول آنالیز واریانس برای آزمون ‎F‏ /115-55 اف 0/0۳00 eon 0/999 ۰ 9 ‏سیر‎ e 99 0/۵99 ۰ ۰ O19 Error 60 90 0 Total , Ps (24.14 ٠ لاست

صفحه 26:
آزمون جداگانه هر کدام از پارامترها * بررسی مخالف صفر بودن هر کدام از پارامترها * آزمون ] sos 0/000 Pleo 0/00۵9 0۵/۵966 ۱6۷0 n 00/0000 ۰ ۰ 0 00/0000 ۸ Date 0/۵6 ۵/6۶ 0/09۴۴ 99 Flood ۵/۵00 ‏وولو‎ OPE MES’? Distance ‏26(<2.78)ا یعنی‌همه ضرایبعدل معنی‌دار هستند.‎ ٠

صفحه 27:
قابلیت رگرسیون: بررسی هم خطی چند گانه بین متغیرها شناسایی از طریق جدول همبستگی ها یا از طریق رسم نمودار زوجی متغیرهای مستقل تغییر ناگهانی و قابل توجه خطای استاندارد» نشان دهنده وجود هم خطی چندگانه است. شاخص شرط (آن)) : نسبت بزرگترین عضو عناصر قطری ماتریس 6 به کوچکترین آنها ‎Cy =a‏ jin

صفحه 28:
ان) بزرگتر یا مساوی: ۲ یعنی‌وجود هم خطی‌چند گانه برای مثال لسلی -۷/۳ است یعنی عدم وجود هم خطی چند گانه راه حل هنگام مواجهه با هم خطی چند گانه زیاد جمع آوری داده های بیشتر خارج کردن متفیرها از مدل روش آنالیز اجزای اصلی روش آنالیز فاکتور

صفحه 29:
ا

صفحه 30:
000 eerie ۳ 1

صفحه 31:

صفحه 32:
(a) Null plot (©) Nonlinearity (©) Heterscedastieity (4) Hieteroscedastieity (© Event-based dependence - ¥ (g) Normal histogram (ty) Nonlinearity ane Neteroscedasticity IGURE 4.5 Grephical Analysis of Residuals

صفحه 33:
Residuals

صفحه 34:

صفحه 35:
© @ © Regression slope without influentials © Typical observation, Regression slope with influentials © Influential observation FIGURE 4.8 Patterns of Influential Observations ‘Adapted from Belsley etal. and Mason and Perreault [2,9].

صفحه 36:
کر

صفحه 37:
© San Mateo + Santa Clara 10 ELEVATION 15 log(PRICE)

صفحه 38:

صفحه 39:
با 15 59 نیما

39,000 تومان