علوم پایه آمار

آمار مقدماتی و پیشرفته

صفحه 1:

صفحه 2:

صفحه 3:
امروزه شامل مقاهیم و روش‌هلئی است که دررتمام پژوهش‌هلیی که مستلزم جمع أورى دادهها.به وسيلة .يك قرا يند أزمليش و مشاهده و انجام استنباط و نتيجه كيرى.به وسيلة تجزيه و تحليل این داده‌ها هستند. اهمیت بسیار دارند. آمار هدر و علم جمع آوری: تعبیر و تجزیه و تحلیل داده‌ها و استخراج تعمیم‌های منطقی در مورد پدیده‌های تحت بررصى است. معادل كلمة آمار در زبان انكليسى 5886151365 است كه از لحاظ تاريخى: از كلمة لاتين 5181115 شده وايكى از معانى كلمة اخيره دولت است. در طول چندین دهه» آمار فقط با بيان اطلاعات و مقادير عددى دربارة اقتصادء جمعيت شناسى و اوضاع سياسى حاکم در یک کشوره سر و کار داشت. حتی امروزه بسیاری از نشریات و گزارشهاي دولتی که توده‌ای از آمار و ارقام را در بردارند و تحت عناوینی از قییل « آمار تولید مزارع» و «آمار کار گران» منتشر می‌شوند. معنی اولية کلمة آمار را در ذهن زندو می کنند. اکثر افراد معمولی هنوز لین تصور غلط را دربارة آمار دارند که َن را منحصربه ستون‌های عددی سرگیجه آور و گاهی یک سری شکل‌های مبهوت کننده می‌دانند. بنابرلين: یدآوری لین نکنه ضروری است که نظریه و روش‌های جدید آماری از حد ساختن جدول‌های اعداد و نمودارها بسیار فراتر رفته‌اند. نمایش‌های عددی به صورت جنبه‌ای فرعی از آمار د رآمده‌اند.

صفحه 4:
دیدگاه‌های زير را درمورد آمار بخوانید. آبا علم آمار اینگونه است؟ دید گاه‌هایی در مورد آمار: * تهيه آمار کاری وقت‌گیر و زمان بر و اصولاً کسالت آور است. * آمار گورستانی از اعداد و ارقام است که در هر اداره و سازمان نمونه‌ای از آن پیدا می‌شود. * آمار مجموعه‌ای از روابط و فرمول‌های ریاضی پیچیده و گیچ کننده است. ۱ ‎oY, Y‏ 1 از زر ی انب وا ۱ 3 ۳ 5و

صفحه 5:
آمر ابزاری است که پسیاری با توسل به آن افکار عمومی را هنقع شود جلپ میکنند آمار مفهومى است که پرای ثبت و تملیش اطلاعات عددی‌به کار می‌رود. مان ‎jy aa‏ گذشته» جمیت تواحی جتوب شهر ‎aa alas Lg‏ برقدة مسابقة دو اعى سمه عن زهان ميقن :به وسيل

صفحه 6:
مثال‌هائی از مطالعات آماری مثالهای زییی نشان‌دهندة مواردی نوعی هستند که در آنها؛ فرایند کسب آگاهی در بررسی یک پدیده شامل گردآوری و تجزیه و تحلیل داده‌هاست و آين خود مستلزم استفاده از روشهای آماری است. پرورش گیاه : * آزمایش پیوندزدن انواعی از گیاهان که از نظر ژنتیکی متفاوتند؛ به منظور تولید كياهان پیوندی پر محصول مورد علاقَهٌ شدید متخصصان کشاورزی است. به‌عنوان بيك مثال ساده؛ فرض كنيد كه قرار است ميزان محصول دو نوع گیاه پیوندی تحت آب و هوا و شرلیط اقلیمی مشخص‌با هم مقايسه شوند. تنها راه كسب اطلاع از ميزان بارورى لين دو نوع كياه نسبت به‌یکدیگر عبارت است از پروراندن آنها در تعدادی از کرتها؛ گرد آوردن داده‌ها دربار؛ میزان محصول آنها و سپس تجزیه و تحلیل داده‌های مزپور.

صفحه 7:
تشخیص بیماری‌ها * _ برای انجام موفقیت آمیز معالجة بسیاری از انواع سرطان‌با عمل جراحیء پرخوردار است و از اين‌رو لازم است که برای انجام معاینات پزشکی مرتباًبه پیمارستان مراجعه شود. چون مراجعة مرتب به بیمارستان و انجام معاینات پزشکی گران و مشکل است. پزشکان در جستجوی نوعی روش تشخیص مؤشر بيمارى هستند كه خود شخص بتواند آن را انجام دهد. برای ارزیابی قابلیت یک روش جدید تشخیص » روش پیماری برحسب درصد موفتیت آنن در تشخیص درست موارد پیماری و اجتتاب از تشخیص‌های ۱ موردنظر بايد روى افراد زیادی آزمایش شود و نتیجه با معاینات پیمارستانی مقایسه شود. برنامه‌های تربیتی و آموزشی برنام‌ای تربیعی و آموزشی که برای انواع متقاضیان (از قییل دانشجویان دانشگاه: کار گران کارخانه؛ گروه‌های اقليت: افراد تاقص‌العضو كودكان عقبافتاده) در بسيارى از زميتدها طرح مى شوند: دائماً مورد بررسی» ارزیلبی و اصلاح قرار می‌گیرند تا سودهندی آنها برای جامعه افزلیش یابد. برای کسب اطلاع از کارلئی برنمه‌های مختلف در مقایسه با یکدیگر, ضرورت دارد که داده‌هلئی دربارة موفقیت‌هایا رشد مهارت افرادی که برنلمه در مورد آنها ‎oS ole!‏ گردآوری شود.

صفحه 8:
تحفیقات اجتماعی-اقتصادی: در بسیایی از قلمروهای جامعه‌شناسی؛ اقتصاد. علوم سیاسی, مطالعمانی در زمینههای مربوط به رفاهاقتصادی گروه‌های قومی گوناگون. هزینههای مصرف کنندگان در سطوح مختلف درآمد و نظرات گوناگون در هنگام وضع یک قانون و منههایینظیر اينها اتجام مىككيرد. این مات نوعاً بر مبناى دادههابى اتجام مى كيرند كه از راه مصاحبه يا تماس با تمونداى از فرادبه‌دست می آیند: که این نموته به وسیلة روشهای آماری از كل جامعداى كه قلمرو مطالمه را تشكيل مىدهدء انتغاب فى شوند. سيس اين داددها مورد تجزيه و تحليل قرار مىكيرند و تغييراتى از موضوع مورد نظر به عمل مى آيد. باذاديالىة با كسترش صنايع ملف و بحث بازار رقابتى در قرن بيست و يك بسيايى از صنابع به بال يافن روش هائى در شناسائى بازار و خواستههاى مشترى. رى با آنها در ازتباط ست به طریق علمی كرديدهاتد. تتايج حاصل همواره با استفاده از مطالعات آمارى روى مشتريان و بها مراكزى كه صورت مى يذيرد. بدعنوان مثال يك شركت توليدكنندة بودر لباسشوثى بس از تحفيق ديبارة ميزان فروش فروشكادهاى يك منطقفه سهم فروش بودر ... را درمى يابد. بس از اعمال تبليغات جديد وو به فاصلة زمانى مناسب این کار مجددا صورت گرفته و سهم افزایش فروش بررسی مىكردد. ويا در همين مقوله براى كسب اطلاع ان ايدكه در توليد مايع ظرفشوئى آيا از لحاظ مصرف كنندكان: بوى اسانس ليمو جا توت فرنكى فاوتی وجود دارد. از ۴۰۰ نفر مصاحبهمی‌شود که ۱۲۵ تفربوى اسانس ليمو و بقيه توت فرنكى را ترجيح فى دهند. كنترل كيفيت: .ببشرفتهاى آمارى در بخمش صنايع بيشتر مربوط به مسائل كنترل كيفى است. استفاده از مفهوم آزمون فرضی‌های آماری در بحث کنترل حین تولید. محصولات توليدى: استفاده از روش‌های نمونه گیری جهت پذیرش برای شناسائی محصول مطلبق دیخواست با استفاده از یک نموته از محصول ‎ole‏ بایرسی صددرصد و استفاده از ابزارهای ساده آمایی در کنترل فرآیند آماری ([6091۳0) ‎(Statistical Process‏ ماد هیستوگرام:نمدار پر کنش: تمودارمیل‌ای و استفاده از بحث طراحی آزمایش‌های مناسب و جمع آوری اطلاعات و بسیاری روش‌های آماری که به صور مختلف مورذ استفادة واقع ‎pg‏ از تلاش مسئولین کیفی صنایع ره خود اختصاص دادهاست.

صفحه 9:
آمارشناس‌ها چه می‌کنند؟ جهان به سوی کمی شدن اطلاعات پیش می رود. در بسیاری از حرفه‌ها و شغل‌هاء تصمیم گیری‌ها به اندازه گیریهای عددی و داده بستگی دارند. داده ها تنها شامل اعداد نیستند؛ بلکه اعداد خود حامل اطلاعاتی در مورد یک سیستم مشخص هستند و احتیا دارند که در سیستم مربوطه تفسیر شوند. با توجه به این رشد در استفاده از داده‌هه نیاز و تقاضا برای وجود آمارشناس‌هایی که در زمینه‌های زیر کارشناس باشند؛ احساس می شود: ارائه و تولید داده‌های قابل اعتماد تجزیه و تحلیل داده‌ها به منظور روشن و واضح ساختن معنای آنها ارائه استتاج‌های عملی از داده‌ها آمارشناس‌ها از توانایی‌های کمّی؛ علم آمار و مهارتهای رولبط عمومی و برقراری ارتباط برای حل بسیاری از مشکلات و مسایل موجود در جامعه استفاده می‌کنند. آمارشناس‌ها در تعیین روش‌های نمونه گیری و جمع‌آوری داده‌هاه نظارت بر اجرای مطالعه. پردازش داده‌ها و نظر دادن در مورد ننایج مطالعات بدستآمده کمک میکنند.

صفحه 10:
فعالیت آمارشناس‌ها در زمینه مطالعه و بررسی نمونه‌ای فعالیت آمارشناسها در مراکز دولتی برخی زمینه‌های فعالیت برای آماری‌ها در مراکز دولتی فعالیت آمارشناس‌ها در زمینه پژوهش‌های علمی فعالیت آمارشناس‌ها در زمینه صنعت و تجارت برخی زمینه‌های فعالیت برای آماری‌ها در صنعت و تجارت فعالیت آمارشناس ها در زمینه بهداشت» پزشکی و سلامت

صفحه 11:
مشخصه‌های شغلی آمارشناس‌ها استفاده از داده‌ها برای حل مشکلات و مسایل استفاده از دانش ریاضی و آمار خود در حل مشکلات اجتماعی: اقتصادی؛ پزشکی» زیست محیطی؛ سیاسی و ... کار کردن هم به صورت انفرادی و هم به صورت عضوی از یک گروه استفاده از علم ار تباطات در برقراری رابطه با متخصصین علوم دیگر و مشورت با آنها و ادامه دادن مستمر فعالیتهای آموزشی گسترش مرزها و قلمرو آمار و احتمال از طریق آموزش و تحقیق

صفحه 12:
سواد آماری جیست؟ سواد آماری یک توانابی اقابلیت است: ۰ توانیی فکر کردن منتقدانه درمورد استدلالها با به كار بردن آمار به عنوان سند يا مدرك قابليت خواندن و تفسير داددهاء قابليت فهم آنجه كه خوانده می‌شود. * 0 توانابى فهم و تفسير آمارهابى كه هر فرد در زندكى روزمره با آنها سروكار دارد. * توانابى استفاده صحيح از آمار توسط هم افراد جامعه سواد آماری؛ بر تصعیمگیری‌ها با استفده از آماربهعنوان سند و مدرک متمر کز شده است. همانگوته که سوادخواندن و نوشتن بر استفاده از كلمات به عنوان مدرك متمر كز شده استء سواد آماری بیشتر درمورد سژالات است قا جراب ها. سوادآماری ‎eee‏ زيادى ندارد. اما مى تولند كمك کند تا سژالات بهتری پرسش شود و در نتبجه تصمم‌ها و قضاوت‌های بپتری صورت گیرد. سواد آماری یک هنر است. هنر تصمیم گرفتن و قضاوت کردن تحت شرایط نامطمئن.

صفحه 13:
با سواد آماری کیست؟ ۰ با سواد آماری کسی است که قادر باشد تفاوت پین رابطه معمول و رابطه علت و معلولی را از یکدیگر تشخیص دهد. * او کسی است که وقتی با جملاتی همانند جملات زیر روبرو می‌شود: درست پا غلط بودن جمله دوم را مدرکی مستند برای درست يا غلط بودن جمله سوم نداند: جمله اول: افرادی که وزن بیشتری دارند بلندقدتر از افرادی هستند که وزن کمتری دارند. جمله دوم: وزن یک رابطه مثبت با قد دارد. جمله سوم: اگر شما وزن بیشتری بدست آوریده انتظار می‌رود که قدتان نیز بلددتر شود. * واضح است که برای بزرگسالان جمله سوم غلط است. اما نمی‌توان نتیجه گرفت که اگر جمله سوم غلط باشد آنگاه جمله دوم نیز غلط خواهد بود. درستی جمله دوم مدرکی است برای درستی جمله سوم اما درستی جمله دوم برای اثبات درستی جمله سوم کافی نیست.

صفحه 14:
با سواد آماری کیست؟ (ادامه) با سواد آماری کسی است که قادر باشد تفاوت بین عبارت "نسبت دادنی" را از عبارت "نسیت داده شده" تشخیص دهد مثال ۰٩درصد‏ خود کشی ها را افراد متاهل مرتکب می شوند. اين آمار به افراد مناهل نسبت داده شده است: اما این بدین معنانیست که اگر افراد ازدواج نکنند این نسبت کاهش خواهد یافت. با سواد آماری کسی است که فرق آماری که بر اساس نمونه به دست آمده را از پارامتر جمعیت تشخیص دهد. باسواد آماری کسی است که بتواند برداشت درستی از درصدهاه میزان ها و نرخ ها داشته باشد مثال: درصد راننده‌ها در میان زنان همانند درصد راننده هایی که زن هستند: نیست. درصد بیمارانی که نتیجه آزمایش آنها در مورد نوعی بیماری مثبت است همانند درصد افرادی که نتیجه آزمایش مثبت دارند و بیمار

صفحه 15:
شیوه‌های جمع‌آوری اطلاعات

صفحه 16:
تعرية 5 بعر حد امكان به صورت ویژه

صفحه 17:
کدگذاری برای داده‌های ‎els‏ یعنی تعیین عدد برای هر طبقه یا دسته. زن ۱ مرد ۲

صفحه 18:
مشخص کردن روش واحدهای اندازه‌گیری 8 وزن شما چقدر است؟ (برحسب کیلوگرم. پوند. گرم) * دیشب چند ساعت تلویزیون تماشا کردید؟ (ساعت., دقیقه)

صفحه 19:
نوشتن سوّالات بدون اریب * با اریب: آیا شما موافقید که افزايش مصرف کود باعث کاهش عملکرد می‌شود؟ * بدون اریب: نظر شما در مورد مصرف کود بر عملکرد

صفحه 20:
سژّالات خود را در یک مطالعةً بيلوت قبل از انجام مطالعٌ اصلی امتحان نمایید * (۸ تا ۱۰ مورد یا واحد از افراد. دانش‌آموزان, درختان و ..)

صفحه 21:
انواع داده‌ها

صفحه 22:
انواع داده‌ها * داده‌های قیاسی داده‌های معیاری Visualizing 2 oe ‏لا‎ ‎a ‎8 8 Data

صفحه 23:
داده‌های قباسی * موضوعات و صفات مورد بررسی يه طبقاتی بر اساس بعضی از صفات کیفی گروه‌بندی می‌شوند.

صفحه 24:
مثال: داده‌های قباسی ° رنگ مو - بلوندء قهوه‌ای قرمزء سياه؛ غیره * نظر دانشجويان در مورد نحوةٌ تدريس ناراحت» خنثی» خوشحال * وضعیت سیگار کشیدن - سیگاری؛ غیرسیگاری

صفحه 25:
طبقه‌بندی داده‌های قیاسی به صورت: اسمی» ترتیبی و دوتایی re od

صفحه 26:
داده‌های اسمی یک نوع از داده‌های» قیاسی است که صفات در طبقه‌های غیرمرتب قرار می‌گيرند. Nominal Data ei airport town mine capital ‘oint x ۰ R * tine tiver road boundary | pipeline A orchard desert forest water = ‏سس‎ | 39

صفحه 27:
مثال: داده‌های اسمی * رنگ مو - بلوند» قهوهاى» مشکی» قرمز؛ غیره نزاد - هندی» افریقایی؛ آمریکایی؛ غيره

صفحه 28:
داده‌های ترتیبی نوعی از داده‌های قیاسی می‌باشند که رتبدٌ آنها مهم استد Ordinal Data kp ote O81 wot! Populated production Places 0 | ‏و‎ high ‏ری‎ ‎> rational ‏هر‎ ‏اوم ع5‎ Rae Roads Drainage ‏ل و و‎ tine major stream fecal erase Area

صفحه 29:
منال: داده‌های ترتبمی خیلی کم. کم متوسط ‎obj‏ خيلى زياد * شدت بیماری * نظر دانشجویان دربارژ درس

صفحه 30:
داده‌های دودویی * شکلی از داده‌های قیاسی که تنها دارای دو طبقه هستند. * داده‌های دودویی می‌توانند یا اسمی یا ترتیبی باشند.

صفحه 31:
منال: داده‌های دودویبی * وضعیت سیگاری بودن - سیگاری؛ غیرسیگاری * حضور — حاضر غایب

صفحه 32:
داده‌های سنجشی * اهداف مورد مطالعه بر اساس بعضی از صفات کمی قابل اندازه گیری می‌باشند. داده‌ها به صورت اعداد می‌باشند.

صفحه 33:
مثال: داده‌های سنجشی سطح کلسترول سن ميزان عملكرد تعداد دانشجویانی که در کلاس دیر حاضر می‌شوند. * زمان لازم برای انجام تکالیف درسی در منزل

صفحه 34:
داده‌های سنجشی تقسیم می‌شوند به Oistrete pr Ovuiiturus

صفحه 35:
داده‌های سنجشی كسسته تنها مقادیر معینی را خواهند داشت (شکافی بین مقادیر ممکن وجود دارد) داده‌های سنجشی پیوسته از نظر تلوریک, هر مقداری در درون یک فاصله را می‌توان با ابزارهای اندازه‌گیری دقیق محاسبه نمود.

صفحه 36:
داده‌های گسسته - شکاف بین مقادیر ممکن it 4 ‏لیلبا‎ 7 6 داده‌های پیوسته - از نظر تئوریکی هیچ شکافی بین مقادیر ممکن وجود ندارد 1000

صفحه 37:
مثال‌ها داده‌هایی با معیارهای کسته نمرات آمار تعداد دانشجویانی که دير به کلاس می‌آیند تعداد جرائمی که به مراکز پلیس گزارش شده است. تعداد دفعاتی که از یک کلمه استفاده می‌شود. عموماً داده‌های گسته قابل شمارش هستند.

صفحه 38:
مثالها: داده‌های معباری ‎iw gd‏ * سطح کلسترول سن * زمان لازم براي انجام تکالیف مدرسه ‎Le gas‏ داده‌های» پیوسته از اندازه گیری بدست میآیند

صفحه 39:
انواع داده‌های جمعآوری شده در یک مطالعه تعیین کنندة نوع م تحلیل آماری مورد استفاده #

صفحه 40:
برای مثال ... * داده‌های قیاسی عموماً با استفاده از درصد (یا نسبت‌ها) خلاصه می‌شوند. - ۱۱درصد دانشجویان دارای خالکوبی می‌باشند. ۳۹/۳۳/۲ و ۸۲۶ دانشجویان در کلاس به ترتیب جدیدالورود سال دوم سال سوم و سال چهارم

صفحه 41:
و برای مثال ... * داده‌های معیاری به طور مثال با استفاده از متوسط یا میانگین) خلاصه می‌شوند. — متوسط وزن مردان در بین ۲۵۰ دانشجوی درس آمار در پاییز ۱۳۸۷ ۳ پوند است - متوسط وزن زنان در بین ۲۵۰ دانشجوی درس آمار در پاییز ۳۸۷ ۸ پوند است

صفحه 42:
آمار توصیفی توصیف داده‌ها با اعداد معیارهایء مکانی

صفحه 43:
چه جیزی توصیف می‌شود؟ * مکان با مرکز داده‌ها چیست؟ (معیارهای. مکانی) * داده‌ها چگونه تغییر می کنند؟ (معیارهای. تغییر پذیری)

صفحه 44:
* میانگین * ميانه معيارهاى مكانى

صفحه 45:
ميانكين نام ديكر متوسط اكر ميانكين يك جمعيت را توصيف كنيم با .لإ نمايش داده مى شود. اگر مينگین نمونه را توصیف کنیم با یمد نمايش داده مى شود. مناسب برای توصیف داده‌های سنجشی به ميزان زيادى تحت تأثير مقادیر غیرمعمول که «برون‌هشت» يا طاح نام دارند» قرار مى كيرد.

صفحه 46:
محاسبة ميانكين ذمونه ‎xX‏ ‎Xai‏ :فرمول ‎X=‏ فرمو ‏یعنی جمع تمام داده‌ها و تقسیم به تعداد آنها

صفحه 47:
ميانه ۰ و نام دیگر برای صدک ۰ هام * مناسب برای توصیف داده‌های سنجشی * مناسب برای داده‌های برون‌هشت. یعنی تحت تا ثیر مقادیر ۲ 3 مب م2 غیرمعمول قرار نمی گیرد.

صفحه 48:
محاسبة ميان نمونه مرتب کردن داده‌ها از کوچک به بزرگ اگر تعداد داده‌ها فرد باشده میانه مقدار وسط می‌باشد. داده‌ها: © 0 9 ۶ 04 داده‌های مرتب شده: 0 8 9 6 6 ale

صفحه 49:
مرتب کردن داده‌ها از کوچک به بزرگ اگر تعداد داده‌ها زوج باشده میانه متوسط دو مقدار وسطی است داده‌ها : 9 4690 © 6 0 6 9 9 0 me passe میانه < (۵+)/0 <

صفحه 50:
مد * مقاديرى كه بيشترين فراوانى را دارند. * یک مجموعه داده مى تواند جندين مد داشته باشد * برای تمام انواع داده مناسب است اما بیشتر برای داده‌های قیاسی یا داده‌های. گسسته با تعداد اند کی از مقادیر ممکن مفید است.

صفحه 51:
در بسرنامة:طده:) Variable (On \(Mean ) (Median ۲۳۱۱6۵8 StDev SE Mean Phone \a39 /\a21.6/ ‏نت‎ 88.1 217.7 18.5 oe 7 ‏كت‎ Variable Minimum Maximum 01 03 ‎Phone 2.0/ 2000.0) 30.0 120.0‏ | / \ | / ا تلعداد دادهها < ۱۲ ‏ف / ميانكين ذمونه

صفحه 52:
مناسبترین معیارهای مکانی بستگی به شکل توزیع داده‌ها دارد

صفحه 53:
:مناسبترین معیارهای مکانی بستگی دارد به ‎ui‏ داده‌ها متقارن هستند یا چوله ‎٠‏ آیا داده‌های دارای یک مد هستند (۳8110001) با دارای چند 1« ‎(nultimodal)‏

صفحه 54:
خا ۵ مه مه جه مه ۱۵ CPs سس مه مه هه مه هه a د هه ده 0

صفحه 55:
متقارن و یک نمایی 8 0

صفحه 56:
رن و یک نمایی 3.0766 1 Orsoriptue Gritotice Variable N Mean Median GPA 92 3.0698 3.1200 Variable Minimum Maximum GPA 2.0200 3.9800

صفحه 57:
متقارن و دونمایی Female Male 1 56 66 76 Height (inches)

صفحه 58:
متقارن و دونمایی Variable N Mean Median TrMean stDev Males 84 70.048 70.000 70.092 3.030 Females 89 64.798 65.000 64.753 2.877 ALL 176 67.313 67.000 67.291 4.017 Variable SE Mean Min Max 01 03 Males 8.331 63.0 76.0 68.0 72.0 Females 0.305 56.0 77.0 63.0 67.0 ALL 0.303 56.0 77.0 64.0 70.0

صفحه 59:
متقارن و دونمایی ‎A‏ هاي ‎height ‎

صفحه 60:
جو له به ور است عادس لك قاط رو قاط ‎Dawber vPOusic OOs vPEpriag‏ a 40 Gequescy ص ص ح ده 1 1 1 1 © 0۳ aw au 0 ucober oP ‏ما‎

صفحه 61:
‎au 0‏ مله ههه © ‎ucober PROD: ‎ ‎ ‎ ‎ ‎

صفحه 62:
Ovsorptve Gtatetis Variable N Mean Median TrMean StDev SE Mean CDs 92 61.04 46.50 52.93 62.90 6.56 Variable Minimum Maximum 01 03 CDs 0.00 400.00 21.50 83.00

صفحه 63:
جوله به جب لد ‎GH a B aw‏ مه 5 دك ضع ‎ab‏ ده ‎yrades: ‎ay ‎a ‎aw ‏ده ‎ ‎erect ‎ ‎ ‎ ‎ ‎ ‎

صفحه 64:
جوله به جب grades

صفحه 65:
جوله به جب Variable N Mean Median TrMean StDev SE Mean grades 22 89.18 93.50 90.60 12.92 2.76 Variable Minimum Maximum 01 03 grades 50.00 100.00 87.00 98.00

صفحه 66:
انتخاب معیار مناسب مکانی * اگر داده‌ها متقارن باشند» میانگین» ميانه و مدء تقريباً برابر * اگر داده‌های دارای چند مد باشند» میانگین میانه و یا مد را 3 و } ‎a‏ ‏براه هر زيركروه كزارش دهيد. * اگر داده‌ها چوله باشند» میانه را گزارش دهید.

صفحه 67:
آمارهای توصیفی توصیف داده‌ها با اعداد معيارهاى تغيير يذيرى

صفحه 68:
چه چیزی توصیف می‌شود؟ * مکان با مرکز داده‌ها چیست؟ * داده‌ها چگونه تغییر می کنند؟

صفحه 69:
معیارهای تغییرپذیری دامنه دامنة ‎Soke ow‏ واربانس و انحراف معیار تمام این معیارها تنها برای داده‌های سنجشی مناسب هستند.

صفحه 70:
دامنه Sf ‏زز‎ ۰ تفاوت بین بزرگترین و کوچکترین داده * به میزان زیادی تحت تأٌثیر برون‌هشت‌ها قرار می‌گیرد. * برای داده‌های متقارن بدون هیچ برون‌هشتی مناسب است.

صفحه 71:
دامنه جیست؟ CRBs oP Gpriay ‏عاوعلیت )0 و639۱‎ ay ص ده هه مه مه جه مه هه مه مه عن مه نه CRO

صفحه 72:
دامنه Orsoriptue Gritotice Variable N Mean Median TrMean StDev SE Mean GPA 92 3.0698 3.1200 3.0766 0.4851 6 Variable ii azn 01 03 GPA ae 3.9800 2.6725 3.4675 < 5.09 - 9.90 = dale 99

صفحه 73:
دامنة بين چار کی * تفاوت بین چارک سوم (درصد ۷۵م) و اولین چارک (درصد ۲۵م) يعنى نيمة وسطی داده‌ها ‎IQR = Q3-Q1‏ * ۰ برای مشاهدات برون هشت و کرانی کارا می‌باشد. * برای داده‌های چوله مناسب است.

صفحه 74:
‎diols‏ بين چارکی چیست؟ ‏عامعلی 306 166۱6۵ بسن 9۳۶) ‎ ‎ ‎ ‏6ه مه م ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‏> هه هه مه هه جه مه هو ‎0 ‎ ‏مه ‎40 ‏ده ‎ ‏و و ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 75:
دامنة بین‌چار کی Orsoriptue Gritotice Variable N Mean Median TrMean StDev SE Mean GPA 92 3.0698 3.1200 3.0766 0.4851 0.0506 . ‏لا‎ Variable Minimum Maximum 7 01 03 GPA 2.0200 3.9800 3 3.4675 IQR = 3.4675 - 2.6725 = 0.795

صفحه 76:
واربانس Number of High School Friends 0 1 4 A Mean = 4 ۱. _ تفاوت بين هر داده با میانگین را بیابید. 2 ین تفاوت‌ها رابه توان دو رسانده و با = ا يا ادك ۳ _به یکی کمتر از تعداد داده‌ها تقسیم کنید. 1 ‎n-‏

صفحه 77:
واربانس اگر واریانس جمعیت را اندازه بگيريم آن را با 08 نشان می‌دهیم. اگر واریانس نمونه را اندازه بگیریم آن را با مج نشان می‌دهیم. متوسط مربع انحراف داده‌ها از میانگین خود را اندازه 2 می‌گیرد. به ميزان زيادى تحت تأثير برون‌هشت‌ها می‌باشد. برای داده‌های متقارن بهتر است. واحدها درجةٌ دوم هستند.

صفحه 78:
انحراف معیار انحراف معيار نمونه ريشة دوم واریانس نمونه می‌باشد و بنابراین با < نشان داده می‌شود. واحدهاء واحدهای اصلی هستند انحراف متوسط داده‌ها از ميانگین خود را اندازه می‌گیرد. همچنین به میزان زیادی تحت تا ثیر برون‌هشت‌ها قرار دارد.

صفحه 79:
واربانس با انحراف معیار چیست؟ 3 aap Ove ae if id و یه 4 ‏مت م‎ apd daw dao dav dap ako aap dap Cpeed (MPH)

صفحه 80:
واریانس با انحراف معیار Median rrttean /stoen\se Mean 90.00 90.83; 11.32) 1.01 110.00 105.62 | 27-39) 1.74 Ql 93 Maximum 120.00 85.00 98.25 162.00 95.00 118.75 N Mean 126 91.23 100 06.79 Minimum 65.00 75.00 Sex female male female male Females: s = 11.32 mph and s? = 11.32? = 128.1 mph? Males: s = 17.39 mph and s? = 17.392 = 302.5 mph?

صفحه 81:
واربانس با انحراف معیار چیست؟ ‎Qpeed‏ مسا سا افععط ‎

صفحه 82:
واریانس با انحراف معیار Sex N Mean Median TrMean Fea SE Mean female 126 152.05 150.00 151. 39| 18. 86 1.68 male 100 177.98 183.33 176.04 0 2.98 Sex Minimum Maximum 01 female 3 200.00 141.67 des 75 male 125.00 270.00 158.33 197.92 Females: s = 18.86 kph and s? = 18.86? = 355.7 kph? Males: s = 28.98 kph and s? = 28.98? = 839.8 kph?

صفحه 83:
oe ضریب تغییر * نسبت انحراف معیار نمونه به میانگین نمونه ضربدر ۱۰۰ ‎oe ۳ 1 5 ۰‏ 1 0 } معیار تغییرپذیری نسبی؛ یعنی تغییرپذیری نسبت به بزرگی داده‌ها ‏* بدون واحد است بنابراین برای مقايسة تفاوت بین دو گروه خوب است.

صفحه 84:
oe ۰ صریب تعییر Median TrMean 7 Mean 90.00 90.83; 11.32) 1.01 110.00 105. ow ۸ 1.74 Maximum 120.00 85. 4 98. 0 162.00 95.00 118.75 W/o) 126 91.2 100 eit Minimum 65.00 75.00 Sex female male female male Females: CV = (11.32/91.23) x 100 = 12.4 Males: CV = (17.39/106.79) x 100 = 16.3

صفحه 85:
oe ۰ Sex N / Mean Median TrMean / StDev\ SE Mean female 126 /152.05) 150.00 151.39| 18.86) 1.68 male 100 we 183.33 176-08 \ 28-94) 2.90 03 Sex Minimum Maximum 1 female 108.33 200.00 141.67 163.75 male 125.00 270.00 158.33 197.92 Females: CV = (18.86/152.05) x 100 = 12.4 Males: CV = (28.98/177.98) x 100 = 16.3

صفحه 86:
مناسبترین معیار تغییرپذیری بستگی دارد به ... شکل توزیع داده‌ها

صفحه 87:
انتخاب معیار مناسب تغییر پذیری * اگر داده‌ها متقارن باشند: بدون هیچ برون‌هشت جدی از دامنه و انحراف معیار استفاده می‌شود. * اگر داده‌ها چوله باشند» و يا دارایب برون‌هشت باشند از دامنة بین‌چار کی استفاده می گردد. * اگر در حال مقایسه تفاوت در بین دو مجموعه داده باشیم» از ضریب تغییر استفاده می گردد.

صفحه 88:
احتمال مجموعه‌ای از قوانین احتمال

صفحه 89:
حادثه ‎dns *‏ یک مشاهده یا آزمایش یا توصیف بعضی از پیامدهای بالقوه * با این حروف نشان داده می‌شوند. © ‎see, BD,‏

صفحه 90:
احتمال بین صفر و ۱ می‌باشد که نشاندهندة احتمال وقوع یک حادثه است. یک حادثه با احتمال صفر یک ‎Bole‏ بی‌اثر است. یک حادثه با احتمال یک یک حادلة قطعی است. نزدیکتر به یکء احتمال وقوع حادثه بیشتر است. احتمال حادنةٌ ۸ را با (36 نشان می‌دهند.

صفحه 91:
مثال‌ها از حادثة بوچ: * یک پرنده انسان شود * یک زن از سرطان پروستات بمیرد.

صفحه 92:
مثال‌های از حادثه‌های قطعی * خورشید امشب غروب خواهد کرد. * نیمسال به پایان خواهد رسید. ‎٠‏ یک نفر خواهد مرد.

صفحه 93:
سه راه برای تعیین احتمالات * روش فراوانی * روش کلاسیک * روش عقيدة شخصی

صفحه 94:
توزیع نرمال و مقدمه‌ای بر توابع پیوسته جكالى احتمال 2

صفحه 95:
48 هیستوگرام درصد a (Qiervals oP size GD 48 Co as 40 ap av ao ده امس

صفحه 96:
هیستوگرام مساحت مستطیل - احتمال a (AQuenvals oP size ‏جلك‎ ‎owe 4 ‏د سه‎ oan | 2 ate ‏وه‎ 6 Oeusity

صفحه 97:
... کاهش اندازهٌ فاصله a (Aitervals oP size ID aa 4 ‏د سه‎ aa Se ‏ص‎ 6 B ap as as aD a Oeasity

صفحه 98:
کاهش بیشتر اندازة فاصله‌ها 0 (Aervals oP size Q dad ad dar dad akD a ap Ao مه 42 مم oa 4 ل هوس ل انس caw 4 مه

صفحه 99:
توابع بيوستة چگالی احتمال ... * منحنی توصیف کنندةٌ احتمال هر محدوده‌ای از مقادیر را کسب مى كند. مثل: ‎P(X > 120), P(X<100), P(110 < K >‏ )120 * مساحت زیر منحنی - احتمال کل مساحت زیر منحنی ۱ * احتمال بدست آوردن یک عدد خاص ۰ است. مثلاً ‎P(X=120) = 0‏

صفحه 100:
ع ویژه‌ای از تیه چکالی احتمال پیوسته ‎p.d.‏ Q@ell-skuped curve oa J awe 4 ewe = ADEAD = € ل مه ‎as 4‏ our 4 eos = AED = 40 cas 4 ل هوس ل مه caw 4 @ @ a ® @ a aw

صفحه 101:
خصوصیات توزیع نرمال متقارن - منحنی زنگوله‌ای شکل منحنی بستگی به ميانگین جمعیت | و انحراف معیار 6 دارد. مرکز توزیع | استد وسعت منحنی بستگی به 0 دارد. بیشتر مقادیر اطراف میانگین هستند اما بعضی از مقادیر کوچکتر و بعضی بزرگتر می‌باشند.

صفحه 102:
مثال‌هابی از متغیرهای تصادفی نرمال * عملکرد تولید کشاورزان در یک منطقه

صفحه 103:
احتمال بالای ۷۵ جقدر است؟ Pobubility studea sores kiyker than ane ‏ل‎ ‎awe 4 ‏ل اه‎ ows 4 بویت با ل مويه 150 as 4 ‏مه‎ oa 4 7 ل همه

صفحه 104:
سطح زیر منحنی - احتمال محاسبة جبری؟ شخصی این کار سخت را برای ما انجام داده است. ما تنها به یک جدول احتمالات برای هر توزیع نرمالی نیاز داریم. اما تعداد بینهایت توزیع نرمال وجود دارد (برای هر میانگین و انحراف معیاری یک توزیع) جواب استاندارد کردن 51810018170126 می‌باشد.

صفحه 105:
استاندارد كردن ... * مقدار « را از میانگین | کم نموده و به انحراف معيار تقسيم کنید. نتیجه مقدار 2 می‌باشد. یعنی: Z = (X- w/o ‏را نرماللستاندارد مینبامنده میانگین آن0 ۵ و لنحراف‎ 7, * ‏معیارعبرلبر با ۱ دارد.‎ ‏سپس از جدول احتمال برای 2 استفاده می‌شود.‎ *

صفحه 106:
استفاده از حدول < Qaadard Oerwal Ourve: Pal probly ‏دح‎ ae وه ae 4 00 4 ao + Qeusity

صفحه 107:
احتمال بين ۶۵ و ۷۰ جیست؟ ous 4 awe 4 ‏ل ص۵0‎ = cas oar 4 abe x <n Dew 6 aw cae 4 oan 4 ل سم

صفحه 108:
احتمای زیر ۶۵ جست؟ ل هوه ‎ow 4‏ ‎one 4‏ ‎was 4‏ our 4 aap 4 ow | ۵۲ oat 4 oa 4 Orades

صفحه 109:
باد آوری! * احتمالات محاسبه‌شده دقیق هستند تنها اگر فروض ایجادشده به طور واقعی درست باشند. * وقتی محاسبات فوق را انجام می‌دهید. فرض شما این است که داده‌ها به طور نرمال توزیع شده باشند. ۰ هميشه ابن فرض را جك كنيد! (بعداً ياد خواهيم كرفت)

صفحه 110:
آزمون فرضیه مقدمه

صفحه 111:
برای دانستن خصوصیات یک جمعیت بزرگتر» ازسیک نمونةً تصادفی استفاده نمایید.

صفحه 112:
دو راه برای یادگیری در مورد یک جمعیت * فواصل اطمینان * آزمون فرضیه

صفحه 113:
فواصل اطمینان * اجازه دهید که با استفاده از داده‌های نمونه؛ مقادیر جمعیت مانند میانگین يا نسبت‌های واقعی را بر آورد نماییم. * مثال: متوسط واقعی زمانی که دانشجوبان در آخر هفته مطالعه می کنند. چقدر است؟

صفحه 114:
آزمون فرضیه * به ما اجازه دهید که با استفاده از داده‌های نمونه» یک ادعا در مورد یک جمعیت را آزمون نماییم. مثلاً اینکه نسبتی از جمعیت يا میانگین جمعیت برابر با یک عدد است. * منال: آیا مقدار واقعی متوسط مطالعةّ دانشجویان در آخر هفته ۰ دقیقه است؟

صفحه 115:
‎Ov!‏ عمومی آزمون فرضیه ‏* یک فرض ابتدایی بسازید. ‏* شواهد را جمعآوری کنید (داده‌ها) ‏* بر اساس شواهد موجود؛ تصمیم بگیرید که آیا فرض اولیه قابل قبول است با خیر.

صفحه 116:
اجازه دهید که این فرضیه را نشان دهیم.

صفحه 117:
منال [بافتويط قيرة ‏ سس "/لااست؟ عقدو اعمال بوازد “كه 1 دانشجو دارای متوسط نمره‌ای به اندازة ۹/۲ باشند اگر متوسط حمعیت ۷/۲ باشد؟

صفحه 118:
تصمیم گیری : آن محتمل یا غیرمحتمل است که ما شواهدی داشته باشیم که فرض اولية ما را تأييد يا رد كند. ‎٠‏ (توجه: محتمل يا غيرمحتمل با محاسبة احتمال مشخص می‌شود) ‎٠‏ اكر محتمل باشدء آنگاه ما فرض اولية خود را رد نمى كنيم. يعنى شواهد كافى براى جيز ديكر نداريم.

صفحه 119:
تصمیمگیری (ادامه) * اگر غیرمحتمل باشد. آنگاه: - یا فرض اولیةٌ ما درست است و ما یک حادة غیرمعمول را تجربه - یا فرض اوليةٌ ما نادرست است. ۰ در آمار: اگر غیرمحتمل باشد. ما تصمیم به رد فرض اولیه فى كير يم.

صفحه 120:
ايده آزمون فرضیه * اول دو فرضيه ارائه مى كنيم» فرضية صفر _ ‎te call yobs ("iy")‏ + * و فرضية جایگزین ‎٠ oad the dtercaive hypothesis (“Te”)‏ خولنده كناهكر نيست:و را" - خولنده كتاهكر لمست :و اك -

صفحه 121:
شناسایی فرضیه‌ها فرضیه‌ای که نیازمند هیچ تغیبری در رفتار جاری ندارد. * فرضیه جایگزین. نتیجه‌ای است که محقق سعی دارد آن را بدست آورد.

صفحه 122:
ادامة مثال * سپس شواهدی مانند اثر انگشت. لکه‌های خون نمونه‌های موء الیاف فرش رد کفشء نمونه‌های. دستخط و غیره جمع‌آوری می‌شود. * در آمان داده‌ها همان شواهد هستند.

صفحه 123:
ادامة مثال * سپس_فرض اولیه ساخته می‌شود - خوانده؛ بیگناه است تا وقتی که ابت شود گناهکار است. * درآمار: ما هميشه فرض می‌کنیم فرضيٌ صفر درست است.

صفحه 124:
ادامة مثال ۰ 5 ۳ ۳7 سپس_یک تصمیم بر اساس شواهد موجود بگیرید. - اگر شواهد کافی وجود داشت (ماورای شک منطقی)؛ فرضيةٌ صفر رد می‌شود. (خوانده گناهکار است). - اگر شواهد کافی وجود نداشته باشده فرضية صفر رد نمی‌شود (خوانده گناهکار نیست)

صفحه 125:
نكتة مهم * هیچ تصمیمی مستلزم اثبات فرضيةٌ صفر یا فرضية جایگزین نمی باشد. ۰ ما فقط اظهار می‌داريم که شواهد کافی برای حرکت در یک راه یا راه دیگر نداریم. 9 این موضوع هميشه در آمار درست است. موضوع این نیست که ما چه تصميمي مى كيريم؛ هميشه شانس اين وجود دارد كه ما تصمیم اشتباه بگیریم.

صفحه 126:
آزمون فرضیه ادامة مقدمه ...

صفحه 127:
واقعیت ERROR OK OK ERROR

صفحه 128:
خطاها در آزمون فرضیه واقعیت فرضية جایگزین ۲ ERROR OK فرضية صفر OK Typed ERROR تصمیم عدم رد فرضيةً صفر رد فرضية صفر

صفحه 129:
تعاریف: انواع خطا * خطای نوع اول: فرضيةٌ صفر رد شود درحالیکه درست است. * خطای نوع دوم: فرضيةٌ صفر رد نشود. وقتی اشتباه است. * همیشه شانس ابجاد یکی از اين خطاها وجود دارد اما هدف ما باید حداقل کردن شانس وقوع این خطاها باشد.

صفحه 130:
‎ul‏ متوسط درجة حرارت بدن ۶/۹۸ درجه است؟ با ‎OT‏ کمتر است؟ ‏متوسط درجةٌ حرارت بدن ۸۰ نفر بزرگسال ۸ درجه است. ‎ ‎

صفحه 131:
منال (ادامه) * تعیین فرضیه درجه 96.0 ۶ ۲ :وبا - درجه 90.8 > ۵ وبا - * فرضيهٌ اولیه را 06.6 ۶ ۱ بسازید. * جمعآورى دادهها: متوسط درجة حرارت بدن ۸۰ نفر نمونه: ۴/۹۸ استى احتمال اين كه درجة حرارت بدن یک نمونة ‎6١‏ نفره از بزركسالان كمتر از 5/48 باشدء اگر دمای متوسط جمعیت ۶/۹۸ باشد. جه مقدار است؟

صفحه 132:
استفاده از ۱ برای تصمیمگیری * ارس ف‌شاندهنه احتمد ل‌اسنکه ما چنیرب‌ونة کولنیرا مشاهده خولهیم کرداگر فرفیة صفر دیستساشده * سل ملحتم ل ؤستبنابيليربيرصفر و يكمياشد ‎٠‏ نزديك به صفر به معناى غير محتمل است. ‎٠‏ بنابرلين لكر .دم كوجك باشد (به طور مثال كمتر از /له» آنگاه فرضیة صفر رد می‌شود.

صفحه 133:
منال (ادامه) 7-0 را بسه آسانیه ی ولاز نرهلفزلوهایآملووهانند ‎MINITAB‏ بسآورد. ‎Test of mu = 98.6000 vs mu < 98.6000‏ ‎The assumed sigma = 0.600‏ ‎Variable N Mean StDev SE Mean 2 ۲‏ Temp 80 98.4 0.67 0.0671 -2.80 0.0026 ‎p-value‏ را عموماً با نشانم‌هند. ‎ ‎ ‎

صفحه 134:
منال (ادامه) * ام بسرلبر ۰۰۲۶/۰ نشانم‌هد که لگر دمای‌متوسط بسدن‌در جمعیت۶/۹۸ بساشد غیرمحتم|‌لستکه بسکضمونةً ۰ نفره بز رگسانلدارلعدمایمتو سطبدن۴/۹۸ باشنده * تصمیم: رد فرضیةً صفر * نتيجه اينكه دماى. متوسط بدن کمتر از ۶/۹۸ می‌باشد.

صفحه 135:
جه نوع خطایی ممکن است برای ما پیش آید؟ ‎٠»‏ خطاى نوع اول در اينجا ادعا در اين مورد است که متوسط دمای بدن کمتر از ۶/۹۸ است درحالیکه واقعاً اینگونه نیست. ‎٠»‏ خطاى نوع دوم در اینجا شکست_در اين ادعا که متوسط دمای بدن کمتر از ۶/۹۸ است درحالیکه واقعاً اینگونه است. ‏ما فرضية صفر را رد كرديم يعنى ادعا كرديم كه دماى بدن كمتر از ۸ است بنابراين ما ممكن است خطاى نوع اول را داشته باشيم.

صفحه 136:
آزمون فرضیه برای میانگین یک حمست

صفحه 137:
منال [بافتويط قيرة ‏ سس "/لااست؟ عقدو اعمال بوازد “كه 1 دانشجو دارای متوسط نمره‌ای به اندازة ۹/۲ باشند اگر متوسط حمعیت ۷/۲ باشد؟

صفحه 138:
مقادیر ۲ ۳۲۵۲ < 2.9) 23024 25 26 28 29 30 31 27 X-bar قدر محتمل است که ۱۰۰ دانشجو دارای میانگین نمره‌ای به اندازةُ ۹/۲ باشند اگر متوسط جمعیت ۷/۲ باشد؟

صفحه 139:
Ho: P= CLP ‏متوسطن مرلنجمعیت<‎ Ha: P= OLR ‏متوسطنمرلتجمعيت>‎ اگر ۱۰۰ دانشجو دارای متوسط نمره‌ای برابر ۹/۲ با انحراف معیار ۶/۰ باشد مقدار ۴ برابر است ‎th‏ PA 2< 2.9( -7]2< )2.9- 2.7(/)0.6/-/100[ =HAZ>3.34=0.0004

صفحه 140:
تصمیم کیری * مقدار ۴) کوچک است. غیرمحتمل است که ما نمونه‌ای به اندازةٌ ۹/۲ داشته باشیم اگر متوسط نمرات جمعیت ۷/۲ باشد. * فرضية صفر رد مىشود. شواهد کافی وجود دارد که متوسط نمرات بزرگتر از ۷/۲ باشد.

صفحه 141:
اصطلاحات 0 < لا تنب در ویر 9.6 2 لا :وبا ‎٠‏ یک آزمون فرضيٌ دنبالٌ راست یا یک طرفه نامیده می‌شود چون مقدار 8) مربوط به دنبالة سمت راست است. ٠ ‏بك‎ - 9.69 را آمارة آزمون می‌نامند. * اگر ها فکر کنیم که مقدار )ها کوچک است یعنی کوچکتر از 7 باشدء آنكاه احتمال ابنكه ها يك خطاى نوع اول بسازیم برابر ۰ است. این مقدار را سطح معنی‌داری آزمون می‌نامند. ما می‌گوییم 0200.06 جاییکه 0 سطح معنی‌داری است.

صفحه 142:
‎ul‏ متوسط درجة حرارت بدن ۶/۹۸ درجه است؟ با ‎OT‏ کمتر است؟ ‏متوسط درجةٌ حرارت بدن ۸۰ نفر بزرگسال ۸ درجه است. ‎ ‎

صفحه 143:
مقادیو م 0۵2۲ > 984( ۶ 987 هوو 995 ووو 983 چقدر محتمل است که ۸۰ بزرگسال دارای یک دمای متوسط بدنی به اندازة ۸ باشد اگر متوسط جمعیت ۶/۹۸ باشد؟

صفحه 144:
متوسط دمایب دن‌جمیج 99.9 < ‎Ho: BP‏ متوسط دمایب دن‌جمعی ۶ 96.9 < ۲ :114 اگر ۸۰ نفر بزرگسال دمای بدن‌شان ۴/۹۸ با انحراف معیار ۶/۰ باشد» مقدار * برابر است با: PX<984) =A Z<(984- 986)/(0.6//801 =A Z<- 2.99=0.001

صفحه 145:
تصمیم کیری * مقدار ۴) کوچک است. غیرمحتمل است که ما نمونه‌ای به اندازة ۴/۹۸ بدسته آوریم اگر متوسط دمای بدن در جمعیت ۸ باشد. * رد فرضيةً صفر. شواهد کافی برای اين نتیجه که متوسط دمای بدن کوچکتر از ۶/۹۸ می‌باشد وجود دارد.

صفحه 146:
اصطلاحات 9 > لا :وبا در ‎ph‏ 99.9 2 لا :وبا آزمون فرضية با دنبالٌ چپ یا یک طرفه نامیده می‌شود. چونکه مقدار ‎PP‏ ‏مربوط به سمت چپ است. آمارة آزمونم‌پ‌اشد 2.0.06 ر]" ۰ £ اگر ما فکر کنیم که مقدار * کوچک است؛ یعنی کوچکتر از ‎etl‏ ‏آنكاه احتمال اينكه ما خطاى نوج اول ايجاد كنيم برا ابر با ۰۲/۰ می‌باشد. يعنى سطح معنىدارى برابر ©0.00) > 0. مى باشد.

صفحه 147:
آيا متوسط زمان صرف وقت براى مطالعه ‎٠١‏ دقيقه است؟ مقدار متوسط ‎١7‏ دقيقه با انحراف معیار ۱۶ دقیقه.

صفحه 148:
P pol P(X-bar < 17) or P(X-bar > 23) 5 5 23 مج 17 ۱ 11 ۳ چگونه محتمل است که ۶۲ دانشجو به طور متوسط حداقل ۱۷ دقبقه و حداکثر ۳ دقبقه صرف مطالعه کنند اگر متوسط جمعیت ۲۰ دقبقه باشد؟

صفحه 149:
تعیین مقدار () متوسطوقنصرفشده < ‎Ho: B= OO‏ متوسطوقنصرفشده 900# = ‎Ha: Pt‏ اگر ۶۲ دانشجوبه طور متوسط ۱۷ دقیقه با انحراف معیار ‎١‏ دقيقه صرف مطالعه کنند» مقدار ۳ برابر است با: ‎AX<19=AZ<(17 20/0464]‏ ‎=A Z<- 1.5]=0.067‏ » MWX>23=0.065 oly P-value = 0.067 x2 = 0124

صفحه 150:
تصمیم کیری * مقدار ۴) کوچک نیستد محتمل است که ما یک نمونه به کوچکی ۱۷ دقیقه و به بزرگی ۲۳ دقیقه داشته باشیم اگر مقدار متوسط صرف شده ۲۰ دقیقه باشد. * فرضيةٌ صفر رد نمی‌شود. شواهد کافی برای اینکه بگوییم مقدار متوسط متفاوت از ۲۰ دقیقه است وجود ندارد.

صفحه 151:
اصطلاحات 00 # | :نبا" در ‎pL‏ 0 2 لا ‎٠ Wo‏ آزمون فرضية دو دنباله یا دو طرفه نامیده می‌شود چونکه مقدار ۴ در هر دو طرف می‌باشد. آمارةٌ آزمونمیپاشد 1.5- < 2 ۰ جون ما در رد فرضية صفر شکست خوردیم ممکن است خطای نوع اول را داشته باشيم.

صفحه 152:
* اگر داده‌ها به طور نرمال توزیع نشده باشند باید دارای یک نمونة بزرگ مثلاً 60 < 2 باشیم.

صفحه 153:
نکتة بسیار مهم * مقدار ۳ شما؛ صحیح نخواهد بود مگر اینکه فرض‌های شما درست باشد. * اگر شما نمونة کوچکی داشته باشید. بایید ببینید آیا داده‌های شما به طور نرمال توزیع شده است يا نه * اگر داده‌ها به طور نرمال توزیع نشده باشند» شما باید یک ‎gsi‏ 8 بزرگ داشته باشید.

صفحه 154:
Destag Lypokeses Oude chou te Oru of Tue Popciows START 1 Pdired t test (samples must coe ‘Are the Yes _frpm normal populations): two samples dependent? z fest (normal distribution): = 3) (tar pee) 2 2 a Ake both, Population— Hse nonparametric metho}s nprmally distributed? Yes Reject ‘After applying the F] of =o} sbparate variances ¢ test test, what do we [amples must come fro! condladd lormal populations) apout Tail, to reject fied variances f test (samples must 55۳ 6 from normal ania where galt DS +(a-DS ‏عي‎ 11 13 and df=n+n-2 به ۳

صفحه 155:
یاد آوری عدم توجه به سطوح اندازه گیری در بکارگیری روشهای مختلف آماری اعسم از آمار توصیفی یا استنباطی» اشتباه رابجی است که در بسیاری از تحقیقات به چشم می‌خورد. سطوح اسمی 560816 01۳01۳881 مقولات یک متغیر به صورت قراردادی کنار هم قرار می‌گيرند. زن یا مرد (همسانی یا ناهمسانی)

صفحه 156:
؟. در سطح ترتيبى ‎:ordinal scale‏ جهت تغییر از کم‌به زیادیا از ضعیف به شدید است. بنابرلين در لين سطح علاوه بر همسانی یا ناهمسانی مقولات» شدت و ضعف و ترتیب آنها نیز مشخص می‌شود ولی چون فواصل بین مقولات مشخص نیست اعداد اختصاص يافته بهآنها از هم فاقد ارزش عددی است. يعنى نمى توان كفت که فلانی سه برابر دیگری به تحصیل علاقه دارد.

صفحه 157:
Interval Scale cic ‏سطح‎ .۳ در این سطح علاوه بر تعیین سطوح مختلف و د تیب منطقی و واقعی ‎oF‏ ‏مقادير يك متغير؛ فاصلة بين مقادير متغير فوق نيز مشخص ميشود. به عنوان مثال ميتوان كفت دانشجوئى كه نمره ‎٠١‏ كرفته است به اندازة ‎٠١‏ ‏نمره با دانشجوئی که نمره ۱۰ گرفته است فاصله دارد. در اين مقياس صفر مطلق وجود ندارد» مثلاً گر دانشجوئی در درس آمار صفر گرفته باشد» نباید فرض کرد که اصولاً فاقد دانش آمار است

صفحه 158:
۴ سطح نسبی 560816 1۴۵0 بالاترین و دقیق ترین سطح اندایه گیری است که علاوه بر تعيين سطوح و مقادیر یک متغير و تعيين فاصله بين مقادير يك متغيرء نسبتها نيز قابل محاسبه و بيان هستند و مبناعه اندازهكيرى نيز صفر مطلق است. مانند ميزان د رآهد يا حساب دانشجو - در لین متفیر اگر حساب دانشجو صفر باشد واقعاً هیچ پولی در حساب او نیست زیرا لین متغیر دارای صفر مطلق است و وجود صفر حقیقی به عنوان مبدا اندازه گیری محقق را قادر می‌سازد تا از روشهای مختلف آماری استفاده کند.

صفحه 159:
شاخص‌های مرکزی شاخص‌های پراکندگی قرینه(سطح توزیع) متقارن یادآوری ‎ol‏ ترتیبی ‏مد مد. میانه اوانی ن فراوانی نسبی چارک‌بند. طبقات چارک‌بندی ‎ ‎ ‏فاصله‌ای یا نسیتی ‏مد. میانه. میانگین واريانس اتحراف معيار دامنه تغییرات ‏چولگی ‎ ‎ ‎ ‎ ‎ ‎

صفحه 160:
تحلیل روابط بین متغیرها آمار توصیفی تنها می‌تولند تصویری از جامعه مورد مطالعه ارلئه دهد. اما قادر به بیان رولبط بین متغیرها و تبیین متغیر یا متغیرهای وابسته نیست زيرا در این سطح محقق در هر مرحله تنها با یک متفیر سرو کار دارد محقق در تحقیقات مخت ف عمدتاً بدنبال تحلیل و تبیین داده‌هاو متغیرهای موردنظر است به همین دلیل سعی ‎Las‏ استفاده از آمار استنباطی به بررسی رولبط بین متغیرهاء تفاوت موجود در بین گروه‌های مورد مطالعه و یا تبیین متغیر وابسته از طریق متغیرهای مستقل و غیره بپردازد.

صفحه 161:
روابط بين متغيرها * آیاارتباطی بین دو با چند متغیر وجود دارد؟ اگر جواب مثبت است. این ارتباط در چه سطحی است؟ ٠ء‏ آيامىتوان تغييرات يك متغير رااز طريق متغير يا 8 } 5 .2 متغیرهای دیگر پیش‌بینی و تبیین کرد؟ پاسخ سژال اول از طریق تکنیک همبستگی و سّال دوم از طریق روش تحلیل رگرسیون امکان‌پذیر است.

صفحه 162:
در رابطهبا تحليل دومتغيره رولبط من مها را ىفاك از ی () ‎)١‏ جداول توافقى '') ضريب برای پیشگویی ساده بهره جست. در رابطه يا جمعييت جند متغيره؛ روابط متغيرها از طريق ‎)١‏ ضريب چند گانه و ۲) ضریب زئی و ی تغییرات یک متغیر از طریق متغیرهای دی با استفاده از رکرسیون چندگانه امکان‌پذیر است.

صفحه 163:
در حاشیه: تفاوت عمدهٌ همبستگی و ر کرسیون تفاوت رگرسیون با ضریب همبستگی درراین است که رگرسیون بدنبال پیش‌بینی است در حالیکه ضریب همبستگی تنها میزان وابستگی دو متفیر را با هم پررسی می کند. در رگرسیون فرض بر این است که متفیر وابسته تصادفی و متفیرهای توضیحی دارای مقذار ثابت باغیرتصادفی (در نمونه گیری تکراری) می‌باشند. در همبستگی فرض بر این است که هر دو متفیر تصادفی هستند. - ضریب همبستگن قادر به بیان روابط ‎le‏ و معلولی بین متغیرها نیست.

صفحه 164:
جدول توافقی هدف از تشکیل یک جدول توافقی نشان دادن هر نوع رابطداى است كه ممكن است بين دو متغير وجود داشته باشد. در مثال حاضر متغیرهای کیفیء جنس (با سطوح مرد و زن) و رد کردن (با سطوح بله و خیر) می‌باشد. 3 مرد از روی جدول روشن می‌شود که در حقیقت رابط‌ای بين اين دو متغير وجود دارد. به طوری که واضحاً نسبت بیشتری از پاسخ‌دهند گان زذ؛ برنامه مورد نظر را رد می‌کنند. رد كردن ‎ay‏ خير 30 20 10 40

صفحه 165:
ضرایب همبستگی مرتبط با متفیرهای اسمی 0 کای‌اسکوثر: یکی از آزمون‌های ناپارامتری است. ۶ لین آزمون توسط فیشر ارلئه شد و قادر است تابه سنجش آماری معنی‌داری تفاوت بسن فراوانیهای مشاهده شده و فراوانی‌های مورد انتظار بدست آمده از جامعه بپردازد. لین آزمون نشان می‌دهد که ‎UT‏ تفاوت موجود بین مقادیر فوق از نظرآماری معنی‌دار است یا این تفاوت عمدتاً براساس شانس است.

صفحه 166:
شرایط استفاده از آزمون کای‌اسکوتر داده‌های مشاهده‌شده بايد به صورت تصادفی گرد آوری شده باشند. کلیه موارد موجود در نمونه باید مستقل از هم باشند. حتی‌الامکان هیچ یک از خانه‌های جدول نباید کمتر از ۱۰ باشند (البته برخی آماردانات تعداد ۵ مورد را ذ کر میکنند) تعلواد نمونه بايد به اندازة کافی بزرگ باشد. پهتر است حجم نمونه در اینگونه تجزیه و تحلیلها حداقل ۵۰ مورد باشد. آماره کای‌اسکوثر می‌تواند برای یک متغیر اسمی و یک متغیر ترتیبی نیز بکار رود. کی ب العمل جهار نوع كود يا جهار سطح از يك ماده شيميائى در دو خاک

صفحه 167:
۲ ضویب همبستگی جوپروف () * به منظور تعيبن شدت وابستگی بين متغيرهاى مورد مطالعه بكار كرفته مىشود و مقدار لن همواره بين صفر و يك در نوسان است. لین آزمون زمائیکه هر دو متفیر اسمس و یا یکی اسمی و دیگری ترتیبی باشد مورد استفاده قرار می‌گیرد. اما نباید تعداد سطر و ستون‌با هم برابر باشندبه عبارت دیگر لین ضریب برای جداول توافقی مستطیلی بکار گرفته می‌شود.

صفحه 168:
ضریب همبستگی فی 7 به منظور بررسی شدت همبستگی بین دو متفیر اسمی که به صورت دووجهی و در قللب جدول توافقی می‌باشد مورد استفاده قرار می‌گیرد به همین دلیل در اینگینه موارد بلید بجای انتتفاده از کای‌اننکویر» از ضریب: همبستگی فی استفاده نمود. * تفاوت ضریب همپستگ فی.با کای‌اسکوثر در لین است که کای‌اسکوثر ن می‌کند در حالیکه ضريب فى شدت همب ان مىدهند. اين ضريب همانند كاىاسكوثر تفسير می گردد و مقدار آن همواره بین صفر و یک

صفحه 169:
۴. ضریب همبستگی توافق پیرسون ‎Pearson s coefficient contingency‏ لین ضریب که آنرابا 0 نملیش می‌دهند میزان همبستگی بین دو متغیر اسمی را که به صورت توافقی تنظیم شده‌اند محاسبه می کند. این شاخص زمانی بکار می‌رود که خانه‌های. جدول توافقی بیش از باشد.

صفحه 170:
۵. ضریب کرامر: * این ضریب برای تعیین میزان شدت همبستگی پین دو متغير اسمی مورد استفاده قرار می‌گیرد و آثرا با نشان می‌دهند که مقدار آن همواره بین صفر و یک در نوسان است لین ضریب در مقایسه با سایر ضرلیب انعطاف بيشترى دارد.به طوريكه هم برای جداول توافقی بیشتر از و هم برای جداول مستطیلی بکار می‌رود.

صفحه 171:
ضرائب همبستگی مرتبط با متغیرهای ترتیبی

صفحه 172:
ا. ضریب همبستگی رتبه‌ای کندال ‎kendall s rank correlation‏ ‎coefficient‏ شاخص کندال حللت تقارن داردبه لین معنا که متغیرها قرینه بوده و برای محقق مهم نیست که کدامیک از متفیرهای مورد مطالعه وابسته و کدامیک مستقل می‌باشد. لین شاخص مشخص می کند که تا چه میزان افزلیش با کاهش در یک متغیر با افزلیش یا كافش در متفیر دیگر همراه است» مقدار ضزییب کثذال هنواره بین ۱- تا اه در نوسان است.

صفحه 173:
۲ ضریب گاما اه مممی؟) شاخص است که از طریق ‎ol‏ می‌توان‌با آگاهی از پاسخهای یک ‎bal‏ و نتلیج متغیر دیگر را پیشگوثی کرد. گاما در واقع میزان کاهش خط را که در نتیجه آگاهی از پاسخ افراد در متفیر مستقا رخ می‌دهد مشخص می‌کند.

صفحه 174:
۳ ضریب همبستگی رتبه‌ای اسپیرمن ‎Gpeacvon (Rak Oorretaivd CoePPivieat‏ * اين ضریب زمانی مورد استفاده قرار می‌گیرد که داده‌ها به صورت رتبه‌ای متوالی ناپیوسته (... و ۳ و ۲ و ) باشد و یا لین که مقادیر اصلی به رتبه تبدیل شوند. در صورتیکه داده‌ها با مقیاس فاصله‌ای یا نسبتی اندازه‌گیری شده باشند می‌توان آنها را به رتبه تبدیل کرد و بعد ضریب همبستگی رتبه‌ای اسپیرمن را محاسبه نمود. * ضریب همبستگی اسپیرمن که آنرا با ۲ نمایش می‌دهند همواره بین ۱+ و ۱- در نوسان است و از لحاظ سطح سنجش نیز ترتیبی و از نوع متقارن می‌باشد به همین دلیل برای محقق مهم نیست که کدام متفیر مستقل و کدامیک وابسته باشد.

صفحه 175:
ضریب همبستگی مرتبط با متغیرهای فاصله‌ای با نسبی

صفحه 176:
ضریب همبستگی پیرسون ‎Prarsou Oorretativa OveFPicieat‏ * از روشهای پرکاربرد جهت تعیین میزان رابطه بین دو متغير مصوب گردیده و با علامت ۲ نشان داده می‌شود. لین ضريب به منظور بررسی رابطه بين دو متغیر فاصله‌ای یا نسبی مورد استفاده قرار می‌گیرد و مقدار آن بین ۱+ و ۱- در نوسان است. ؟ اگر این ضریب مثبت باشد به معنای آن است که تغییرات در برد و متغیر به طور هم جهت اتفاق می‌افتد و بالعکس.

صفحه 177:
فاصله‌ای با نسبی دوحالنی جندحالتی ‎aes‏ چندحالتی ‎dae‏ ضریب جوپروف ‎wv ‘ay‏ یب توافت ضریب چویروف ی ضريب كراصر ‎oe‏ ‏اضريب فى با كراصر ‎ot ‎ ‎ ‏- تن ۷ کرام - ضريب فى لاندا ‏-کندال توا (برای جداول توافقى ‎(ox‏ ‏- کندل او >(برای جداول توافقی ستطبلی) - ضویب همبستگی ربه ای ‎eel‏ ‎wr‏ ‏مقادير قاصله اى به رتبه اى ‏تبديل و ضريب هميستعى رقبه ‏أى اسبيرمن با كندال تائو محاسية مى شود ‎ ‏فاصله‌ای با نسبی ‏عقادير فاصله اى به رقبهاى تبديل و ضریب همبستکی رتیه أى اسبيرمن با كندال ‎ee tne‏ شود ‏ضریب همبستکی ‎ome‏ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 178:
GSS: دو نکته در رابطه با ضریب همبستگی وجود دارد که توجه به آنها بسیار ضروری است. للف- وجود همبستگی بین دو متغیر به معنای لین نیست که آنها دارای اثرات مساوی هستند ویا یکی علت دیگری است. زیرا ممکن است هر دو تحت تأثیر عامل دیگری ‎tbl,‏ به عنوان مثال اگر بین میزان غیبت از کار و رضلیت شغلی رابطه متغفیر وجود داشته باشد نمیتوان نتیجه گرفت که دلیل زیاد بودن غیبت عدم رضایت شغلی است زیرا ممکن است که غليب بودن خود باعث احساس عدم رضلیت شغلی باشد ويا هر دو تحت ثير عامل ديكر قرار كرفته باشد. ب- همبستكى ساده نشان مىدهد كه بين دو متغير جقدر ارتباط خطى وجود دارد.

صفحه 179:
انتخاب آزمون مناسب برای مقايسة میانگین‌ها * چنانچه دادههاى مربوط به متغير وابسته از نوع كمى با مقیاس (فاصله‌ای يا نسبی) و دادههاى متغير مستقل يا كروهبندى از نوع کیفی با مقیاس (اسمی یا ترتیبی) باشد برای بررسی تفاوت ها می‌توان به مقایسه میانگین‌ها پرداخت و معنی‌داربودن تفاوت‌های موجود بین طبقات یا گروه‌ها را مورد بررسی قرار داد.

صفحه 180:
۰ ۳ وو آزمونهای پارامتری * آزمونهای ] و عمده‌ترین آزمونهای آماری برای مقايسة میانگین گروه‌ها می‌باشند. از آنجا که گروه‌های مورد بررسی ممکن است مستقل با همبسته باشند بنابراین هر یک از آزمونهای فوق به دو بخش مستقل و همبسته تقسیم می‌شوند. تصميم كيرى در مورد این که در چه مواقعی باید از آزمونهای ‎t‏ ‏یا 7 مستقل یا همبسته استفاده کرد مهمترین مسأله در تحلیل داده های کمی است.

صفحه 181:

صفحه 182:
پیش‌فرضهای آزمونهای پارامتری آزمونهای پارامتری 1و *) را با پیش فرضهای زیر میتوان مورد استفاده قرار داد: مشاهدات از یک جامعه نرمال انتخاب شده باشند. اطلاعاتی که با هم مقایسه می‌شوند بلید تقریباً واربلنس یکسانی داشته باشند (در نمونه‌های بزرگ اگر واریانس یک گروه دو برابر دیگری باشد باز هم می‌توان از آزمونهای پارامتری استفاده نمود) داده‌های گردآوری شده دارای مقیاس فاصله‌ای یا نسبتی باشند. اگر اطلاعات جمع آوری‌شده لین سه شرط را نداشت می‌توان داده‌های فوق رابه غیر پارامتری تبدیل کرد و از روش‌های آماری غیرپارامتری استفاده نمود. روش عمده تبدیل دادههای پارامتری به غیرپارامتری, رتبه‌بندی کردن آنها می‌باشد.

صفحه 183:
للف - آزمون؛ اگر متغیرمستقل یا متغیر گروه‌بندی تنها دو گروه داشته باشد. (اگر بخواهيم درآمد زنان و مردان را با هم مقایسه کنیم)

صفحه 184:
ب- آزمون 6(تحلیل واریانس ‎(ANOVA‏ اگر تعداد گروهها بیش از دو باشد. (اگر بخواهیم میزان درآمد گروههای شغلی کارگر, کارمند و کشاورز را با هم مقایسه کنیم) نکته: آزمون 1۳ تنها معنی‌داری تفاوت بین میانگین گروه‌ها را مورد بررسی قرار می‌دهد اما مشخص نمی‌کند که لین تفاوت‌ها در بین کدامیک از گروه‌های مورد بررسی وجود دارد. به همین دلیل برای لیک که بدانیم تفاوت‌های بدست‌آمده در پین کدامیک از ت وجود دارد و از لين طریق مقایسه‌ای بین گروه‌ها انجام گیرد. بلید از ازمون شف ‎ob & Tukey s5 bel! 31, LSD & (Scheffe test)‏ 7 استفاده کرد. لین آزمونها میانگین زوج‌ها رابا همدیگربه صورت دوبدو مقایسه کرده و وجود اختلاف معنی‌دار بین آنها را نشان می‌دهد.

صفحه 185:
این روش کل واریانس موجود در یک مجموعه از داده‌ها را به دو بخش تقسیم می‌کند. *_بخشی از این واربانس ممکن است بخاطر شانس و تصادف حادث شده باشد و بخش دیگر ممکن است ناشی از دلایل یا عوامل خاصی باشد. از طرف دیگر واریانس موجود ممکن است ناشی از تفاوت بین گروههای مورد مطالعه و یا بخاطر تفاوت موجود در درون نمونه‌ها حادث شده باشد. *_ مهمترین اصل در تحلیل واریانس (/۱60۷(/) آزمایش تفاوت‌های موجود در بین میانگین‌های جوامع پا گروههای مورد مطالعه از طريق بررسى ميزان واريانس بين كرودها نسبت به واریانس درون گروه‌هاست. *_ در واربانس درون جامعه فرض بر این است که تفاوت پین مقدار نسبت به میانگین جامعه بخاطر شانس است در حالیکه در بررسی تفاوتهاى بين جوامع و كروههاء فرض بر اين است كه تفاوت بين ميانكين جامعه يا نمونة لام با ميانكين كل به دليل عوامل خاص مى باشد. بنابراين زملنى كه از تحليل واریانس استفاده می‌شود فرض می‌گردد که هر یک از نمونه‌ها از یک جامعه نرمال انتخاب شده‌اند و هر یک از این جوامع نیز واریانس برابری دارند همچنین فرض می‌شود کلیه عوامل بجز عواملی که مورد مطالعه می‌باشند تحت کنترل هستند.

صفحه 186:
در تحلیل واریانس, اگر در بین میانگین گروههای مختلف تفاوت معنی‌داری وجود داشته باشد تنها از طریق 966066 نمی‌توان محل این تفاوت‌ها را بدست آورد. اكر به مقايسة سه گروه (6 9۰60۰ بپردازيم و تفاوت معنىدارى در بين آنها وجود داشته باشد نمی‌توانیم قضاوت کنیم که لیا لين تفاوت‌ها بین 09 و © است یا بين 68 و دیاین وه در چنین مواقعی نبلید از طریق آزمون ابه مقایسه دوبدو گروهها پرداخت, زیرا هر قدر تعداد دفعاتی که آزمون !انجام می‌گیرد پیشتر باشد سطح اطمینان نتایج پائین می‌آید. (در این موارد باید از آزمونهلئی مانند آزمون شفه. آزمون چنددامنه دانکن, آزمون ‎SF‏ و آزمون استیودنت نیومن, کیول برحسب ضرورت استفاده کرد.

صفحه 187:
تحلیل واریانس یکطرفه: Ovewoy @udbsts ۲ ‏حول‎ اگر محقق تنها یک متغیر (درآمد) را انتخاب کند و بخواهد تفاوت بین طبقات یا گروههای مختلف را بررسی کند در این صورت از تحلیل واریانس یکطرفه استفاده می‌کند. تحلیل واربانس دوطرفه: حجووبو() ۴و ‎Two ww Ordpsts‏ لگر محقق بخولهد لثر دو علمل را بر روییک متفیر وابسته بررسی كند بايد از تحليل وار بانس دوطر فه استفاده کند.

صفحه 188:
آزمونهای غیربارامتری همانطوری که قبلاً نیز بعث گردید آزمونهای پارامتری علاوه بر لين که نیاز به داده‌هلئی از نوع فاصله‌ای دارند بلید از برخی از پیش فرض‌های اولیه نیز برخوردار باشند (نرمال بودن توزیع در جامعه و داث مه ود وی دهد چام با هم مورد مقایسه قرار می‌گيرند و ...

صفحه 189:
* اما در آزمونهای غیرپارامتری چنین پیش‌فرضهائی مطرح نبوده و زمانی که داده‌ها در سطح اسمی و يا ترتیبی باشد و يا در صورتیکه گروه‌های مورد مطالعه از واریانس- نابرابر و یا از چولگی برخوردار باشند بلید از آزمون‌های غیرپارامتری استفاده کرد. لین آزمون‌ها از ویژگی‌هلئی برخوردار هستند که آنها را از آزمون‌های پارامتری متمایز کرده است:

صفحه 190:
‎.١‏ این آزمونها هیچکدام از پیش‌فرضهای مطرح شده در آزمونهای پارامتری, نظیر نرمال بودن جامعه و يا برابر بودن واریلئس گروهها را مبنا قرار نمی‌دهد و حتی در صورت صادق نبودن مفروضات فوق در خصوص داده‌های فاصله‌ای به منظور استفاده از آزمونهای پارامتری امکان تبدیل داده های فوق به داده‌های غیرپارامتری و رتبه‌ای و محاسبه آزمونهای ناپارامتری وجود دارد. ‏۲_ از آنجا که در لين آزمونها از مقادیر رتبه‌ای و حتی داده‌های اسمی استفاده می‌گردد. بنابراین محاسبة آنها کار ساده‌ای است. ‏۳ این آزمونها در مقایسه با آزمونهای پارامتری از دقت بالائی برخوردار نمی‌باشند. دلیل ن لین است که با تبدیل داده‌های فاصله‌ای به مقادیر رتبه‌ای, فواصل واقعی موجود در بين دادهها به فواصل يكسان بين رتبه‌ها تبدیل شده و در این فرآیند بخشی از اطلاعات ناپدید می گردند ‎a‏ عبارت دیگر با تبدیل مقادیر اصلی و واقعی به مقادیر رتبه‌ای, بدلی از واقعیت ساخته می‌شود و لین بدل بدست آمده به جای واقعیت مورد ‏تجزیه و تحلیل قرار می‌گیرد.

صفحه 191:
انتخاب آزمون غیریارامتری مناسب

صفحه 192:
: آزمورن‌شانه 4۰ زمانی که داده‌ها به صورت همبسته باشند مورد استفاده قرار مرت

صفحه 193:
: آزمون مک نمار ۰ اغلب در مواردی بکار برده می‌شود که داده‌ها به صورت اسمی و مربوطبه دو نمینه مرتبط ‎Two) poet‏ 0 با همسته باشند (زمانی که بخواهیم نظرات قبلی و بعدی افراد را مورد مقایسه قرار دهیم)

صفحه 194:
مثال۱. ابتدا در مورد یک موضوع نظر افراد را به صورت موافق یا مخالف جویا می‌شویم پس از آن نسبت به برگزاری کلاس آموزشی اقدام می‌کنيم (یاجلسة توجبهی) و سپس دوباره نظر افراد را نسبت به موضوع جویا می‌شویم. در اینجا فرض صفر (10]) اين است كه تفاوتى بين نظرات افراد در قبل و پس از اجرای برنامه (دورة آموزشی) وجود ندارد. مثال۲. نظرات ۱۰۰۰ نفر درباره خرید و عدم خريد یک کالا قبل و بعد از برگزاری برنامه تبلیغاتی و معرقی کالا پرسیده شده است با اين آزمون می‌توان مشخص نمود که آیا برنامه تبلیغاتی در تغییر نگرش مشتریان موثر بوده است یا خیر.

صفحه 195:
۳[زمون ویلکاکسون مه * در بسیاری از پژوهشهائی که نمونه‌ها به صورت جفت شده و همبسته هستند ممکن است محقق بخواهد هم جهت تغییر و هم میزان تغییر را مورد بررسی قرار دهد. برای اين منظور آزمون ویلکاکسون تست مناسبی است. * داده های مورد استفاده در این آزمون حداقل باید در سطح ترتيبى باشند. * مثال: نظر تعدادی از مشتریان در رابطه با دو نوع کالای مشابه اما با مارک‌های متفاوت از نظر کیفیت محصول سوّال شده است.

صفحه 196:
۴ آزمو & ‎Fridman Test (ow p‏ آزمون فریدمن یکی از آزمونهای غیرپارامتری است لين آزمون در واقع معادل آزمون ‎F‏ در روشهای پارامتری می‌باشد اما در اینجا برخلاف آزمون ‎OAK‏ توزیع نرمال و برابر بودن واریانس ضرورتی ندارد. این روش برای مقایسه سه گروه یا بیشتر از سه گروه همبسته بکار می‌رود. مثال: نظرات ۲۰ نفر از فراگیران را درخصوص سه روش مختلف تدریس جویا شدهایم و پاسخ‌ها نیز از ۱ (بسیار نامناسب) تا ۵ (بسیار مناسب) امتیازبندی شده‌اند.

صفحه 197:
۵.آزمون کوکیان یکی از روشهای ناپارامتری و درواقع تعمیم‌یافته آزمون مک نمار است.با اين تفاوت که این روش برای مواردی که تعداد گروهها یا تکرار سه یا داده‌های لین آزمون به صورت اسمی می‌باشد و وجود تفاوت بین نظرات افراد را مورد بررسی قرار می‌دهد. مثال: نظرات افراد نسبت به یک موضوع در زمانهای مختلف پرسیده می‌شود - قبل از برگزاری یک دورة آموزشی (موافقت - مخالفت) - بعد از پرگزاری دوره (موافقت - مخالفت) بعد از اجراى عملى محتؤيات دوره. (موافقت - مخالفت) از سه باشد بكار م رود

صفحه 198:
۶آزمون من - ویتنی ‎Mann - Whitney Test‏ * برای مقایسه میانگین‌های دو جامعه مستقل زملنی که داده‌ها به صورت رتبه‌ای یا ترتیبی باشند مورد استفاده قرار می‌گیرد. * مثال: فرض كنيد دو كروه ۰ نفره از فراگیران با دو ریش متفاوت اموزش ديده و نتيجه ارزيلبى انها از دورهدهاى فوق در قالب امتیازات ۱ تا ۵ گرداوری شده است.

صفحه 199:
۷ آزمون کولموگروف - اسمیرنف Kolmogrov - Smirnov Test * چنانچه در بحث کای‌اسکوئر گفته شد اگر فراوانی‌های مورد انتظار بیش از ۲۰ درصد خانه‌های جدول, کمتر از ۵ باشد. در این صورت نمی‌توان از فرمول کای‌اسکوثر استفاده کرد. این مشکل معمولاً زمانی پیش می‌آید که حجم نمونه کمتر از ۰ باشد و یا تعداد خانه‌های جدول بیشتر باشد. در چنین حالتی می‌توان از تست کولموگرف - اسمیرنف استفاده کرد. اساس این آزمون مقایسه فراولنی تجمعی نسبی مشاهده شده با فراولنی تجمعی نسبی مورد انتظار می‌باشد.

صفحه 200:
‎A‏ آزمون کروسکال - والیس ‎Kruskal - Wallis Test‏ ‏* لین آزمون در واقع معادل تحلیل واریلنس یکطرفه می‌باشد, اما برخلاف لَن نيازى به مفروضات لن نظیر اينکه نمونه‌ها از یک جامعث نرمال بدست‌آمده باشند و یا اینکه انحراف معیار یکسانی داشته باشند وجود ندارد. آزمون کروسکال والیس زماتی استفاده می‌شود که تعداد نمونه‌ها بیش از دو گروه باشد. مثال: از ‎٩۰‏ نفر دانشجو در سه رشته مختلف درخواست شد تا کیفیت برنامه‌های آموزشى دانشكده را ارزيلبى کفند: امتبازات. اراک شده توسط افراذ قوق از ‎١‏ (بسيار ضعيف) تا 0 (بسيار قوى) در نوسان بوده است. 0 بین: ظرلتدلنشجویانر شتههایمختلف ت فارتمعنار یوجود ندارد. این آزمون اگرچه وجود تفاوت بین نظرات گروه‌های مختلف را نشان می‌دهد اما مشخص نمی کند که اين تفاوت در بین کدام یک از گروهها وجود دارد.

صفحه 201:
Median test s4ileo 49037 * یکی دیگر از روشهای غیرپارامتری است که برای مقایسه سه یا بیشتر از سه گروه مورد استفاده قرار می‌گیرد. اطلاعات مورد نیاز در لین روش باید در سطح رتبه‌ای بوده و حتی‌الامکان داده‌ها همرتبه نباشند. زیرا اگر میانه مشترک بین گروهها جزو نمرات تکراری باشد در اين صورت تشخیص تفاوت گروهها با مشکل مواجه میگردد. * مثال: می‌خواهيم بدانیم لیا سرعت عمل کارگران سه شیفت مختلف یک کارگاه خیاطی با هم متفاوت است یا خیر؟ * پرای لین کار تعداد شلوار دوخته شده توسط ۴۰ کارگر (از سه شیفت مختلف) در یک هفته گردآوری شده است.

صفحه 202:
طبقه‌بندی روش‌های تحلیل چندمتغیره

صفحه 203:
۰ انتخاب روش مناسب برای تجزیه و تحلیل داده‌ها مهمترین قدم در تحلیل داده‌های گرد آوری شده محسوب می گردد. * متأسفانه به دليل عدم آشنائى با منطق حاكم ب بر روش‌های مختلف آمارى جند متغيره؛ به اشتباه يكى به جای دیگری مورد استفاده قرار مى كيرد و تكنيكهاى مختلف به طور نابجا بكار كرفته مى شوند.

صفحه 204:
به منظور آشناشی با نحوه بکارگیری روش‌های چند متفیره در تجزیه و تحلیل داده‌ها؛ درخت تصمیم گیری برای استفادهٌ اصولی و متناسب با نوع داده‌ها و هدف تجزیه و تحلیل ارائه شده است؛ این طبقه‌بندی بر مبنای سوالات و مفروضات خاصی انجام گرفته است: A آیا داده‌های مورد نظر قابل تقسیم به متفیرهای مستقل و متغیرهای وابسته هستند؟ اگر چنین تقسیم‌بندی امکان‌پذیر است؛ چند متفیر از موارد فوق» متغیر وابسته می‌باشند؟ متفیرهای موجود در تجزیه و تحلیل در چه سطحی اندازه گیری شده‌اند؟

صفحه 205:
پاسخ این سه سوّال محقق را در تصمیم‌گیری برای انتخاب منأسب‌ترین تکنیک تجزیه و تحلیل چند متغیره کمک می‌کند. ياسخ سؤال اول مشخص مى كند كه آيا با يد از تكنيكهاى وابستككى ‎b » yi oe! (Dependenc Technique}‏ پاید از تکنیکهای هم وابستگی ‎(Interodependence Technique)‏ بهره گرفت. روشهای وابستگی ‎ON pie Ay pete de LS GT 59 ASF te SSeS‏ متغیرهای وابسته لحاظ شده و تغیبرات آسن براساس متفیرهای مستقل دیگر مورد بررسی و تبیین قرار می‌گیرد مانند روش رگرسیون چند گانه یا تحلیل واربانس چند متغیره و غیره. روش‌های هم وابستگی تکنیک‌هائی هستند که در آتن متغیرهای مستقل و وابسته وجود ندارد؛ بلكه در آین روش‌ها مجموعه متفیرها به طور همزمان و با هم مورد تجزیه و تحلیل قرار می گيرند. مانند روش تحلیل عاملی.

صفحه 206:
روش‌های تحلبل چندمتفبره آيا بعضى از متغيرها وايستهائدة 1 صل | [سوپریی ۳ | سیشیت ] | [ مت ل ‎rer‏ يعد ‎ss ss ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 207:
‎ore‏ ی دی يدك سیم وابسته از نوع پارامتری باشده روش ‏مناسب برای تجزیه و تحلیل آن تحلیل رگر: انه است. ‏* چنانچه داده‌های فوق دارای یک متفیر وایسته ‎ake‏ اما متغیر فوق از نوع غیرپارامتری ‏دووجهی باشده روش مناسب رگرسیون لوجیستیک و تحلیل تشخیص چند گانه است. ‏چنانچه متغیر وابسته غیرپارامتری چندوجهی باشد باید از تحلیل تشخیصی استفاده شود در ‏تحلیل تشخیصی متغیسر وابسته از نوع غیر پارامتری و متغیرهای مستقل از نوع پارامتری ‏اما چنانچه متغیرهای وابسته و مستقل هر دو غیرپارامتری باشند روش مناسب برای تجزیه و ‏تحلیل داده‌ها رگرسیون لوجیستیک می‌باشد. ‏تحلیل مسر روشی است که هم برای داده‌های پارامتری و هم غیرپارامتری سازگار است. ‏اگر متفیرهای مربوط به موضوع مورد بررسی دارای چند متفیر وابسته باشد در این صورت ‏دو تکنیک دیگر برای تجزیه و تحلیل مناسب خواهند بود. ‏- اگر متغیرهای وابسته پارامتری باشند تحلیل واریانس چند متغیره یا تحلیل همبستگی کانونی مناسب خواهد بود ‏- اما اگر متفیرهای وابسته مورد نظر غیر پارامتری باشد می‌توان از طریق تبددیل آنها به متغیرهای مجازی کدبندی شده به صورت (۰۱ ۰) از روش تحلیل کانونی استفاده کرد. ‎

صفحه 208:
روشهای هم‌وابسستگی بر مبنای وجود یعدم وجود متغیرهای وابسته مورد تجزیه و تحلیل قرار نمی گیرند زيرا در لين روشها کلية متغیرهابه طور همزمان وبا همدیگر بررسی می‌شوند لین ع روشها از نظر پارامتری یا غیرپارامتری بودن داده‌هابه دو گروه جدا گانه تقسیم می‌شوند. - پارامتری: تکنیکهای تحلیل عاملی و تحلیل خوشه‌ای - غیرپارامتری: داده‌های غیرپارامتری از طریسق كدبندى متغير مجازی (به صورت صفر و یک) قلبل بکارگیری در روشهای تحلیل عاملی و تحلیل خوشه‌ای هستند. 5 ع و 35 از سوی دیگر هم داده‌های پارامتری و هم غیرپارامتری قابل استفاده در تکنیک مقیاس‌بندی چندبعدی می‌باشند.

صفحه 209:
ر گرسیون

صفحه 210:
> آوری داده‌ها * سه روش اصلى براعه جمع آورى ذاددها: - مطالعات قبلی بر اساس داده‌های تاربخی - مطالعة مشاهده‌ای - طرح آزمايشى (بهترين حالت)

صفحه 211:
کاربرد ر گرسیون * توصیف داده‌ها * برآورد پارامترها * کنترل

صفحه 212:
نقش کامپیوتر * تحلیل رگرسیون نیازمند استفادهٌ هنرمندانه و هوشمندانه از کامپیو تر است. ‎)٩, 0۱۸۰‏ رصلام-86 ,86۳866 ,650665 ۰

صفحه 213:
. Zz ‏ركرسيون و مدل سازى‎ * تحليل ركرسيون: يك تكنيك آماره براى بررسی و مدل‌سازی. ارتباط بین متغیرها ۰ کاربردها: مهندسی» علوم فیزیکی و شیمیایی. اقتصاد» مدیریت؛ علوم زیستی و بیولوژیکی و علوم اجتماعی * تحلیل رگرسیون شاید گسترده‌ترین تکنیک آماری مورد استفاده می‌باشد.

صفحه 214:
* تحلیل رگرسیون این امکان را برایه محقق فراهم می‌کند تا تغییرات متغیر وابسته را از طریق متغیرهای مستقل پیش‌بینی و سهم هر یک از متغیرهای مستقل را در بین متغیر وابسته تعیین کند.

صفحه 215:
تحلیل رگرسیون و ضریب همبستگی ركرسيون رابطة نزدیکی با ضریب همبستگی دارده بدين معنا كه برای انجام رگرسیون باید ضریب همبستگی را محاسبه کرد. اگر میان متفیرهای مورد مطالعه همبستگی وجود داشت تنها در این صورت است که می‌توانیم از رگرسیون برای آزمون فرضیه‌های تحقیق استفاده نمائیم.

صفحه 216:
تحلیل رگرسیون مفهوم رگرسیون برای اولین بار توسط فرانسیس گالتون در سال ۱۸۷۷ مورد استفاده قرار گرفت. او در مطالعه خود نشان داد که قد کودکان متولد شده از والدین بلندقامت گرایش به برگشت به متوسط قد افراد دارد. وی در یک مقالة مشهور اظهار داشت: اگرچه تمایل برای والدین بلندقد به داشتن فرزندان بلند قد و نیز والدین کوتاه قد به داشتن فرزندان کوتاه قد وجود دارد اما متوسط قد بچه‌های والدین متعلق به هر طبقهٌ قدی معين به طرف متوسط قد در کل جامعه برگشت با گرایش دارد ‎(Qeyess)‏

صفحه 217:
تعبیر نوین تحلیل رگرسیون * تعبیر جدید رگرسیون کاملا متفاوت از حالت قبل است به طور کلی می‌توان گفت: * تحلیل‌های رگرسیون به مطالعة وابستكى يك متغير (متغير وابسته) به یک یا چند متفیر دیگر (متغیر توضیحی) می‌پردازد که با تخمین یا پیش‌بینی مقدار متوسط یا میانگین مقادیر متفیر نوع اول در حالتی که مقادير متغير نوع دوم معلوم یا معیسن شده باشند (در نمونه گیری تکراری) صورت می‌پذیرد.

صفحه 218:

صفحه 219:
+ و ۰ ۰ 5 ‎w‏ 5 تحلیل ر گرسیون در مقام مقایسه با تحلیل رابطة علیت * هرچند تحلیل‌های رگرسیون وابستگي یک متفیر به سایر متغیرها را بررسی می کند اما الزامً ببانگر حالت علست نمی‌باشد. بنا به كفته كندال و استوارت يك رابطة آماری ‎see‏ قوی و واضح هرگز نمی‌تواند پایٌ ارتباط علی (سببی) قرار بگیرد. ایده‌های ما از علیت باید خارج از حيطة آمار و مالآ از تگوری با غیر آن حاصل شود. ۰ مثلاً نمی‌توان گفت که بارند گی به عملکرد محصول وابسته است.

صفحه 220:
تفاوت عمده همبستگی و ر گرسیون & در رگرسیون فرض بر این است که متغیر وابسته تصادفی و متغیرهای. توضیحی دارای مقدار اببت با غیرتصادفی (در + # . 5 ۳2 . نمونه گیری تکراری) می‌باشند. در همبسستگی فرض بر این است که هر دو متغیر تصادفی هستند. * ضریب همبستگی قادر به بیان روابط علی و معلولی بیین متغیرها نیستد

صفحه 221:
‎Sg 2۰‏ ۳ 8 و ا گر وابستگی متفیری تنها بر روی یک متفیر توضیحی بررسی شود. چنین بررسی به عنوان تحلیل رگرسیون ساده یا دو متغیره معروف است. ‎é.. 2 ۰‏ 3 ۰ ۰ نت اگر وابستگی یک متغیر بر روی بیش از يك متغير توضیحی بررسی گردد؛ تحت عنوان رگرسیون م رکب معرفی می‌گردد.

صفحه 222:
رگرسیون خطی و غیرخطی * خطى بودن از نظر متغيرها و6 + رم حمق ‎Boxy + BX‏ + ديل * خطی‌بودن از نظر بارامترها دو له + حجر

صفحه 223:
جزء استو کاستیک (تصادفی) تابع ر گرسیون جامعه جزء تصادفی جامعه () نماینده یا جانشینی برای تمامي متفیرهای حذف شده‌یا فراموش‌شده که بر متفیر وابسته لثر می‌گذایند ولی در مدل ر گرسیون وجود ندایند ليابه دللیل گوناگون نمی‌توانند در مدل گنجانده شوند). Vi =P, + Box + Us

صفحه 224:
اهمیت جزء اخلال استو کاستیک و تعبیر آن جزء استو کاستیک نماینده‌ای برای تمامی متغیرهائی است که از مدل حذف شده اما مجموعاً بر مواثر مى كذارد حال ال این است که چرا این متغیرها صریحاً در مدل معرفی نمی‌شوند؟ به بیان دیگر چرا یک مدل رگرسیونی هركب با ثمام متغيرهاى ممكن بسظ دادهنمی‌شوند. دلايل فراوانى وجود دارد: ۱ _ ممکن است تلوری ناقص باشد یعنی از تًثیرگذاری بعضی از متفیرها بر متغیر وابسته بی‌اطلاع باشیم.ء ؟. ممكن است راجع به بعضى از متغيرها داددهاى اندكى داشته باشيم. *. جمعآوری داده در مورد بعضی از متغیرها به نسبت تأثیر آنها در مدل ممكن است بسيار زياد باشد. .2 به دليل ماهيت تصادفى بودن متغير وابسته؛ توضيح كامل آلن ممكن نيست و جزء اخلال مى توافد آثرا منكس ممکن است در اندازه گیری خطا صورت گرفته باشد. ع. با تأسی به قاعدة أکام (توصیف راجع به پدیده‌ها حتی الامکان ساده در نظر گرفته شود: و اینکه خلاف آنن ثابت نشده است) مطلوب است مدل ر" را تا حد همکن ساده‌تر بگیرٍ

صفحه 225:
06 2 + ۰ تخمين مدل ر گرسیون دو متغیره روش حداقل مربعات معمولی ‎Ordinary bewet Square (OLG)‏ برطبق فروض اصلی. روش حداقل مربعات چند خاصیت بسیار جللب آماری دارد که یکی از مشهورترین و قویترین روشهای تحلیل رگرسیون رابه وجود آورده است (لين روش به کارل فردریک گوس ریاضیدان نامی آلمان نسبت داده می‌شود).

صفحه 226:
مشاهدات 3

صفحه 227:
ع

صفحه 228:
قاعدة کلی حداقل مربعات ۱ لا لا ‎=B, + Baxi t+ 4‏ رل لا لا بلا بر - و دو + رح بر ©+26-6+6+6 Mi 2 =S(y- y) =S(y- By- Bard)

صفحه 229:
روش حداقل مریعات؛ تخمینهای منحصر بفردی از 3 را كه كوجكترين مقلداو ‎Sar‏ را به نمركه ‎outs aS‏ بدهدء مهيا مى سازد. تخمین زننده‌های حداقل مربعات د | ع ‎UN” LHSHN‏ و 1 رز( = ‎By‏ 1-۳

صفحه 230:
این تخمین‌زننده‌ها خصوصیات جالبی دارند که عبارتند از: منحصراً برحسب مقادیر قابل مشاهده بیان می‌شوند (مثلاً و در یک نمونه) این تخمین زن‌ها» تخمین‌زن‌های نقطه‌ای هستند یعنی در نمونه داده شده با هر تخمین‌زن فقط مقدار منحصر به فردی (نقطه) براى بارامتر جامعة مربوطه ارائه مىكند (بنابراين خط ركرسيون را مى توان به آسانى برازش نمود)

صفحه 231:
فرضیات اساس روش حداقل مربعات ۶ اگر هدف ما تنپا تخ تحلیل رگرسیون هدف 6 یو واقعی می‌باشد. * براى رسيدن به ابن هدف نه تنها بايد شكل تبعى مدل را معینی دربارة چگونگی بوجودآمدن 2و 1 را نیز مطرح سازیم: ن الأو ‎Po‏ باشد. روش ‎SOLO‏ است اما به ياد داريم كه در بدستآوردن ,6 و ريست ‎Sb‏ هدف استنتاجاتى دربارة كنيم بلكه بايد فرضيات J =B, + BX, + Y * اين معاهله نشان می‌دهد که هم به :۲ و ۳ هميه لأ بستك, دارد. بنابراين نا زمانى كه ‎‘git‏ 7 ديدست مل ند هيع راهى براك د اب به ۱ ‎Po |‏ تخواهيم داشت. از این رو فرضیات مبتنی بر متفیرن؟" و جزء خطا برا تفسير ممتبرى از تخمیتهای ارگرمیون اهمیت ‎Eo‏

صفحه 232:
آنچه به عنوان مدل رگرسیون خطی عمومی: گوسی. کلاسیک با استاندارد معروف می‌باشد» مبتنی بر فرضیات زير است قرفل سكين بها عيرس Hulx,) =0 ‎linge la ght Huddy yiilyl‏ سمو :3 اللرومن سازأنست: ‎

صفحه 233:
فرض ۲: عدم وجود خودهمبستگی بین ده cotu,u)=Hu- Hu)|y- Au) =Huu,) =0 اكر بين دسها حالت الف یا ب وجود داشته باشد آنگاه خودهمبستگی یا همیستگی پیوسته وجود خواهد داشت.

صفحه 234:
فرض ۳: یکسانی (همسانی) واریانس 2)ها vatulx) =Eu- Hu)|* =u) =0 Fu)

صفحه 235:
در مقلبل لين حللت شکل زیر واریلئس شرطی جامعةٌ 7 همراه با افزلیش مقدار لا افزلیش می یلبد, لین حللت به ناهمسانی واریلنس و یا ناهمسانی در پراکندگی معروف است. F(x)

صفحه 236:
فرض ؟: کوواریانس صفر بین و ,6( ,,() ‎cotu, x) =Hu.x) =0‏ فرض نمودیم که »«و ب(که می‌تواند تأثیر تمام متغیرهای حذف شده را نشان دهد) دارای تأثیرات جمع پذیر و مجزا بر مومی‌باشند اما اگر 26 و لد همبسته باشند. تشخیص تأثیر خاص و مجزای هر کدامشان بر موممکن نیست. بنابراین اگر و بدبه طور مثبت همبستگی داشته باشند 6ابا افزایش ب افزایش و با كاهش ى کاهش می‌یابد به همین شکل اگر 2 و تبه طور منفی همبسته باشند ابا افزايش 1 كاهش وبا کاهش ب افزایش می‌یابد وبه هر ترتیب جداکردن تأثیر لاو بدبر ۷ مشکل است.

صفحه 237:
فرض ۵: مدل رگرسیون دقیقاً تصریح شده است (عدم وجود خطای تصریح يا تورش) سژالات فوق بسیار مهمند چراکه با حذف متغفیرهای اصلی از مدل انتخاب شکل تبعی غلط و یا مطرح کردن قرض‌های آماری نادرست دربارةٌ متفیرهای مدلء اعتبار تفسیر رگرسیون تخمین‌زده شدهء زیر سوال خواهد رفت.

صفحه 238:
از ميان تمامى فرضهاء اين فرض انعطاف‌ناپذیر ترین و شاید در نظر اول دارای کمترین محل اعراب باشد. يك مدل ركرسيون در يك تحقيق با تصريح مدل لبن در رابطه با يديدههاى مورد نظر شروع می‌شود. بعضى از سؤالات مهم كه در تصريح مدل پدید می‌آیند عبارتند از: ‎١‏ چه متفیرهائی باید در مدل جای گیرند؟ شکل تبعی مدل چیست؟ آيا اين مدل از نظر پارامترها خطی است يا از نظر متفیرها و یا هردو؟ ۳ فرض‌های احتمالی ارائه شده در مورد؛ ,۷ و ,و بدهای درون مدل چه می‌باشند؟

صفحه 239:
متأسفانه در عمل: شخص به ندرت از متغیرهای صحیحی که باید در مدل منظور شود. شکل تبعی صحیح و یا فرض احتمالی صحیح در مورد متغیرهای وارد شده در مدل اطلاع دارد. بنابراین در عمل کارشناس از بعضی قضاوت‌ها در انتخاب تعدادی از متغیرهای واردنشده در مدل یا شکل تبعی مدل استفاده کرده و برخی فرض‌ها را در مورد ماهیت تصادفی متغیرهای مشمول در مدل پیش می کشد و در انتخاب مدل صحیح برای تحلیل تجربی تا حدی مستلزم آزمون و خطاست.

صفحه 240:
بر |كند كن ‎ew‏ قيلييس

صفحه 241:
Inflation (%) Unemployment

صفحه 242:
خصوصیات تخمین زننده‌های حداقل مربعات: قضیةٌ گوس- مار کف یک تخمین‌زن ,]را زمانی میتوان بهترین تخمین‌زن بدون تورش خطی (0۷۵۵) از 6 دانست كه: ‎oN‏ تخمينزن خطى باشد. يعنى تابعى خطى از يك متغير تصادفى مانند متغير وابسته #ادر مدل ركرسيون باشد. رمه تخمین‌زن بدون تورش باشد ۰۰ ۳/۰ (ي/ ‏۳ تخمین‌زن در بین تمام تخمین‌زننده‌های بدون تورش خطی: حداقل واریانس را داشته باشد (تخمین زن بدون تورش با حداقل واربانس به تخمین‌زن کارا معروف ‏است). ‎

صفحه 243:
Dre @ass-Oarhov ‏:وه(‎ (PLOE). 1 min Var( 39) = Var(3q) 30:00 ‏الك ار‎ 90 > 0 )مما 8 ‎min Var‘‏ 3 91 الل لا كك ۱۱ i B= i

صفحه 244:
قضيةٌ گوس - مار کف با توجه‌به فرض‌های مدل کلاسیک ر گرسیون حطی» تخمین زننده‌های حدلقل مربعات در بین تخمین‌زننده‌های خطی. بدون تورش و دارای حداقل واریانس یعنی 91,61(6) می‌باشند.

صفحه 245:
ضرائب تعیین /۷(معیار خوبی برازش) و ضریب همبستگ ‎re‏ ‏ضریب همستگی: 0 ۲ میولند مثبتها منفی‌ساشاد این کمیت بین دو مقدار ۱+ و ۱- می‌باشد. ۳ این کمیت ماهيتاً فرینه می‌باشد یعنی ضریب همبستگی بين *او م یعنی ,۳معادل ضریب همبستگی بين ۶و (یع) >« است. ؟. این کمیت مستقل از مبدأً و مقیاس اندازه گیری است. ۵ الو آمارى مستقل باشند ضريبٍ همبستككى بين آنها صفر است و 0 2 به این معنا 0 خوطی است و برای توصیف ارتباطات ‎See es ae Cons‏ بیانگر یک ارتباط دقیق است اما میزان ۷ هرچندکه )بسكن خط ‎wit aaah tegen‏ ای ‎WS ge ce ly akg‏

صفحه 246:
م ‎pete‏ ‎x = x — x‏ © م 9 ‎y y‏ 1 8 ج منفى اما نزد يكك يهدصفر : مثبتاما نزد يككبه صقر > نزدیکک به و- ‎x x x‏ 3 © م 0

صفحه 247:
در زمينة رگرسیون. گمعیار پرمعناتریه از «است چرا که ©م نسبت تغییرات متفر وابسته توضیح داده شده به وسیلاً متغیرهای توضیحی را ارائه می‌دهد درحالیکه -فاقد چنین خصوصیتی است. به علاوه ‎yor (R=) jes‏ یک مدل رگرسیون م رکب زير سژال می‌باشد.

صفحه 248:
شش برای حداکثر کردن ‎RE‏ گاهی محققان سعی در حداکثر کردن ‎۲٩‏ دارند یعنی انتغاب مدلی که بالاترین 1۲۹) را به دست می‌دهد. اما انجام این کار ممکن است خطرناک باشد زیرا در تحلیل رگرسیون هدف ما آن نیست که تنها یک 6 بالا به دست آوريم. بلكه هدف بدست آوردن تخمينهاى قابل اطمينانى از ضرائب حقيقى ركرسيون جامعة اصلی و استنباط آماری دربارة آنهاست. در تحلیل‌های تجربی بدست آوردن یک ‎RO‏ بسیار بالا چندان معمول نبوده بلکه حتی گاهی برخی از ضرائب تخمین‌زده شدة رگرسیون از لحاظ آماری بی‌معنی بوده یا دارای علامت‌هائی برخلاف انتظارات بنابراين محقق بايد دقت بيشترى دربارة ارتباط منطفى يا تتوریکی متفیرهای توضیحی یا متفیر وابسته و معنی‌داری آمارى آنها داشته باشد. اكر 9 بالا بدست آوريم خوب خواهد بود اما اكر © بايين باشد اين امر به معنى بدى مدل نمىباشد.

صفحه 249:
فرض نرمال: مدل ر گرسیون خطی نرمال کلاسیک

صفحه 250:
توزیع احتمالی اجزاء اخلال ‎uy‏ برای کاربرد روش حداقل مربعات معمولی (9,ا)) در مدل کلاسیک رگرسیون خطی؛ هیچ فرضی در مورد توزیع احتمالی جزء اخلال با ارائه نکردیم. تنها فروضی که در مورد به مدنظر قرار گرفت عبارت بودند از این که اجزا مذ کور دارای امید صفره عدم همبستگی و واریانس ابت هستند.

صفحه 251:
* اگر هدف ما تنها تخمین پارامترها باشد در این‌صورت روش ,ا) کافی خواهد بود اما تأکید بر تخمین تنها یکی از جنبه‌های استنتاج آماری است و جنبة دیگر آزمون فرضیه می‌باشد. * از آنجا که هدفمان هم تخمین پارامترها و هم آزمون فرضیه است. لذا احتیاج به تعیین توزیع احتمالی جزء اخلال به خواهیم داشت.

صفحه 252:
فرض نرمال بودن Ay) =0 ‏میانگین‎ * Au?) =o? * واریانس ‎Auu,) =0‏ We UM ‏کوواربانس‎ *

صفحه 253:
طبق قضية مشهور آمارى حدى مرکزی می‌توان نشان داد که اگر با تعداد زیادی از متغیرهایه مستقل و تصادفی که دارای توزیع احتمللی یکسانی هستند مواجه باشیم در این صورت به استثناء چند حالت خاص با افزایش تعداد متغیرها به سمت بی‌نهایت توزیع مجموع آنها به سمت توزیع نرمال ميل مى كند.

صفحه 254:
خصوصیت تخمین‌زننده‌های )ا() تحت فرض نرمال بودن ‎١‏ بدون تورش هستند ‏۲ دارای حداقل واریانس هستند ‏۳ سازگاری: یعنی همانطور که حجم نمونه به سمت بینهایت افزایش می‌یابد. تخمین‌زننده‌ها نیز به مقادیر جامعه‌شان نزدیک می‌شوند ‏۴ _ژبه طور نرمال توزیع شده است ‏0 رثلیه طور نرمال توزیع شده است ‎ ‏ع عبارت ‏ یل ر) از توزیع کای‌دو با درجة آزادى (©-(0) تبعيت مى كند. و ‎a A op‏ از . زلوزیم شد‌اند. / در گروه تخمین‌زننده‌های بدون تورش خطی يا غیرخطی دارای حداقل 2 ‏واریانسن هستند ‎

صفحه 255:

صفحه 256:
ر گوس 3 دو متغيره: تخمین فاصله‌ای و آزمون فرضیه

صفحه 257:
فاصلة اطمینان از آنجائیکه فاصلاٌ اطمینان تصادفی است. احتمالهای بدست آمده می‌بایست در معنای درازمدت فهمیده شوند؛ یعنی نمونه گیری تکراری به طور مشخص,تر به این معنی است که: اگر در نمونه گیری تکراری؛ فواصل اطمینان (plZ,- exp <A, +e)=1- a) پراساس احتمال « تعداد زیاد ساخته شوند آن‌گاه در درا ‎a)‏ -1 چنین فواصلی در مورد از تعداد کل موارد» مقدار حقیقی پارامتر را در بر "00 له -1) هى كير ند. مدت به طور متوسط

صفحه 258:
آزمون فرضیه و انتخاب سطح معنی‌داری خطاى نوع اول: احتمال رد كردن فرضية درست. خطاى نوع دوم: احتمال قبول فرضيةٌ نادرست. براساس هزينة هر كدام از خطاهاى فوق. محقق اقدام به انتخاب سطح معنى دارى خواهد نمود.

صفحه 259:
نقض فروض مدل کلاسیک مدل کلاسیک رگرسیون خطی نرمال براساس چند قرض ساده شده به شرح زیر است: فرض ۱: میانگین شرطی جزء اخلال جامعه مشروط به مقادیر مفروض متفیرهای توضیحی ‎phe (Lox)‏ است. فرض ۲: واریانس شرطی ب ثابت یا همسان است. فرض ۳: خودهمبستگی در اجزا اخلال وجود ندارد. '. فرض ؟: متغيرهاى توضيحى غير تصادفىاند. حتى اگر تصادفی هم باشنده مستقل از اجزا اخلال ى توزیع شده‌اند. فرض 3: بين متغيرهاى توضيحى (ها) همخطى مركب وجود ندارد. فرض۶: به ها به طور طبیعی با میانگین و واریانس داده شده در فروض ۱ و ۲ توزيع شده‌اند. فرض ۷: مدل رگرسیون به طور صحیح تصریح شده است؛ یعنی تورش تصریح وجود ندارد.

صفحه 260:
با این فروض دیدیم که تخمین‌زنهای حداقل مربعات معمولی (01:08) ضرائب ركرسيون, بهترین تخمین زنهای بدون تورش خطى 8|000 مى باشند. فروض ۰۱ ۲ و ۶ را به دلایل زیر به طور مفصل مورد بحث قرار نخواهیم داد: فرض : امید صفر جزء اخلال: اگر ایین فرض تأمین شود نمی‌توان ان عرض از مبدأ اصلى را تخمیسن زد و چون در بسیاری از حالت‌های کاربردی» جزء عرض از مبدأ اهمیت اچیزی دارد چندان تأثیری نخواهد داشت. فرض ؟: حللت تصادفی‌بودن متفیرهایی توضیحی: اگر «هابا وجود تصادفی‌بودن به طور مستقل از دها توزیع شوند آن گاه براء ای تمام مقاصد کاربردی ها را می‌توان غیراستو کاستیک فرض كرد. فرض۶: نرمال بودن به اگر هدف ما صرفاً » لین فرض ضروری نیست. فرض نرمال بودن به منظور آزمون فرضیه و پیش‌بینی بسیار مهم است.

صفحه 261:
همخط یکی از فروض مدل کلاسیک رگرسیون خطی این است که هیچ گونه هم‌خطی مر کب بین متفیرهای توضیحی isle ‏موجود ون مج ورد‎ Outicolicearity 36 2 ‎do 90‏ توجه داشته باشيد كه هم خطى 5 تنها ارتباطات خطی بین ص 5 متغيرهاى كا را شامل مى شود 8 عد و ارتباطات غيرخطى بين آنها را در بر نمی‌گیرد. ‎do 90‏ ‎V=Bo* BX + BX + BX + Uy 66 deo‏ ‎aso‏ 50 اگر همخطی وجود داشته باشد ضرائب رگرسیونی متغیرهای ‏ نامعین و انحراف معیارشان بی‌نهایت است. (هم‌خطی کامل) هم‌خطی ویژگی‌های 15لاا8 بودن تخمین‌ها را نقض نمی کند.

صفحه 262:
یج عملى هم خطى الف - بز ركى واريانس و كوواريانسهاى تخمين زتهاى 08ر01 ب- فواصل اعتماد عریض‌تر: احتمال قبول شدن يك فرضية غلط (مثلاً خطاى نوع دوم) ج- نسبتهاى غيرمعنادار ‎wr‏ مقادير ؛ كوجك مىشوند و فرضية صفر به معناى صفربودن بارامترهاى جامعة واقعی مورد قبول واقع می‌شود. د- 09 بالا اما تعداد اند ک نسبت‌های معنادارء ه حساسیت تخمینزنهای را و خطای معیار آنها نسبت به تغییرات اندک در داده‌ها

صفحه 263:
کشف هم‌خطی الف- ‎.١‏ در هم‌خطی سژال از درجه است نه از نوع. تمایز معناداری يبن حضو عم شور هم‌خطی وجود ندارد؛ بلكه تمايز بين درجات گوناگوا است. ‏۲ از آنجایی که همخطی به شرایط متغیرهای توضیحی برمی گردد که فرض شاو غيرتصاذفى باشند لذا ابن حالت شكلى ‎oto. ‏از نمونه است نه ‏جامعه بنابرایین ماآزمون برای هم‌خطی صورت نمی‌دهيم. بلکه می‌توان ‏درجه‌اش را در نمونهٌ مشخص اندازه گیری نمود. اب- ‎.١‏ 09 بالا اما تعداد كم نسبتهاى ؛ معنى دار شدید بین دویدو متغیرهای توضیحی ۳. امتحان ضرائب جزئی ؟. ركرسيونهاى معين ۵. ريش مشخصه (صسمب8©) و شاخص وضعيت (ط-1/ مصطده9©) ‎ ‏در برنامة 585 از ريشة مشخصه و شاخص وضعيت براى تشخيص همخطى استفاده مى کنند.

صفحه 264:
رفع مشکل هم خطی: قاعدة محکم و دقیقی جهت چاره‌جوئی مشکل وجود ندارد؛ چرا که هم‌خطی ‎bel II‏ یک مشکل نمونه‌ای است. ‎.١‏ اطلاعات قبلی (تئوریکی) ‏۲ تركيب كردن داده‌های مقطعی و سری‌های زمانی (داده‌های مر کب) *. حذف متغيرها و تورش تصريح ‏؟. تبديل متغيرها ‎۵ ‏داده‌های جدید يا اضافی (افزایش حجم نمونه)

صفحه 265:
ناهمسانی واریانس ‎Wetervsvedusticity‏ ‏یکی از مهمترین فروض مدل ر گرسیون خطی کلاسیک این است که اجزاء اخلال بد که بر تابع ررگرسیون جامعه ظاهر می‌شوند. دارای واریانس همسان ‎Ely) =0°‏ هستند. يا با افزايش يك متغير (درآمد) متوسط متغير ديكر .بس انداز) افزايش مى يابد ‎Gadel say‏

صفحه 266:
اگر فرض ناهمسانی را جایگزین فرض همسانی نمایيم تخمین‌زن ‎aya Bp‏ ۵ هست اما دیگر کارا یا بهترین نیست و دارای حداقل واریانس نیز نمی‌باشد در این حالت از روش تخمین معروف به حداقل مربعات تعمیم‌یافته (0۷۵) استفاده می‌نمائيم نتایج کاربرد روش ‎OLG‏ در شرایط وجود ناهمسانی واریانس * فاصلٌ اطمینان براساس بیش از حد لازم بزرگ خواهد شد و در نتیجه آزمون‌های !و ۴) احتمالا نتیج غلطی به ما خواهند داد.

صفحه 267:
کشف ناهمسانی واریانس روش ترسیمی:ابندا رگرسیون را براساس فرض عدم ناهمسانی تحلیسل کرده و سپس مجذور باقیمانده‌های تخمین‌زده شده ‏ هرا مورد بررسی قرار داد تا ببینیم چه الگوی سیستماتیک و منظمی را نشان می‌دهند. واریانس جزء اخلال به طور خطی یا متفیر > مربوط است. ۲. . آزمون پارک: پارک روش گرافیکی را در قالب فرمول بیان داشته است. ۳ _ آزمون گلدفلد- کوانت ۴ _ آزمون گلچس ۵ آزمون بروج پاگانت ع. آزمون وایت

صفحه 268:
یکی از فروض مهم مدل کلاسیک اين است که خودهمبستگی سریالی بین اجزاء اخلالی که در تابع رگرسیون جامعه وارد می‌شود وجود ندارد. ماهیست خودهمبستگی: همبستگی بسن اعضای سری‌های مشاهداتی است که در زمان (سریهای زمانی) یا مکان (داده‌های مقطعی) ردیف شده‌اند. Alyu,) 40 j#7 ش‌ ۳ اگر محصول در یک فصل کم باشد دلیلی بر کم 1 بودن محصول در فصل دیگر نمی‌باشد (عدم خودهمبستگی)

صفحه 269:
تخمین ۸69( در حالت وجود خودهمبستگی 55 * در حالست خودهبسستگی تخمینزن ‎CLG‏ ۵ ‏تخمينزن‎ 5 act BLOB co pet SHOVG ۰ ‏چنیسن خصسوصیتی ندارد. تخمین‌زن‎ اطلاعات موجود بيشترين را می‌کند. ‎a.‏ * _ درحالت وجود خودهمبستگی نیز همانند حالت تخمينزنهاى 01/08 خطى و بدون ش و لذا سازكارند ولسی کارا نیستند (یعضی ‎Seal‏ نمسای ‎ ‏فاصلة اعتماد مب درصد در هل0 و ‎GLS‏ 3 ‎ ‎ ‎bole J‏ ندارند) * . فواصل اعتماد بزرگتر از حالت معمول خواهد پود ‎OV)‏ به 0۵)

صفحه 270:
تخمین ۵)باا) بدون در نظر گرفتن خودهمبستگی ‎ -‏ احتمالاً واریانس باقیمانده مقدار واقمی سیگما به توان دو را کمتر از حد تخمین میز ‏در نتيجه 089 بيش از حد تخمين زده مىشود. ‏- آزمونهاى معنىدارى !و “) معتبر نيستند و اگر آنها را بكار_يبريم نتليج بسيار غلطى در مورد معنىدارى آمارى ضرايب تخمينزده شدة رگرسیون به‌دست خواهيم آورد. ‎

صفحه 271:
زمون دوربین واتسون : مشهورترین آزمون تشخیص همبستگی سریالی است ‎DD‏ فروض زیربنایی آزمون 0.00) مدل ر گرسیون دارای جزء عرض از مبداً اسث ۲. متفیرهای توضیحی غیرتصادفی هستند ۳ اجزاء اخلال به وسیلهٌ الگوی خود ر گرسیونی مرتبه اول حاصل می‌شوند. ؟. مدل ر گرسیون شامل مقادیر با وقفه‌ای از متغیر وایسته به عنوان یکی از متغیرهای توضیحی نیست. ۵ هیچ مشاهدةٌ مفقوده‌ای در داده‌ها وجود ندارد.

صفحه 272:
1 3 + یکی از فروض ‎SW‏ تصریح مدل بودبه عبارت دیگر فرض بر لین بود که تورش یا خطای تصریح در مدل وجود ندارد. این موضوع بسیار گسترده و پیچیده می‌باشد و بسیاری از مباحث آن بالاتر از سطح مفروض ما می‌باشد. این قسمت دوب كيرئدة مسائل زیر است: مدل خوب با صحیح متضمن جه خصوصیاتی است؟ فرض كنيد كه يك مدل صحيح براى تحليل يك مسألة خاص ارائه شده است امابه علت در دسترس نبودن آمار و ارقام» سهل‌انگاری. ملاحظات هزینه‌ای یا ستی. مدل متفاوتی را بکار بردیم و بتابراین نسبت به مدل صحيح مرتكب خطاى تصريح شدهايم. حال سؤال اين است كه در عمل وقوع جه نوعى از شکل‌های مختلف خطاهاى تصریح وجود دارد؟ نیج انواع مختلف خطای تصریح کدامند؟ طرق كشف اين نوع خطاها كدامند؟ اكر به ارتكاب خطاى تصريح بى برديم جه راههابى براى دستبابى و بركثت به مدل صحبح وجود دارد؟ در ۵ مورد بالا فرض بر اين بود كه يك مدل صحيح وجود دارد وما مايل به دانستن مشكلات عارض در اثر كاربرد مدل ديكرى بوديم اما اككر اصلا ندانيم كه كدام مدل صحيح است دجار خطاى تعيين غلط مدل مى شويم كه با خطاى نوع قبلى يعنى خطاى تصربح متفاوت است.

صفحه 273:
خصوصیات یک مدل خوب منطقی متغفیرهای توضیحی: یک فرضیه (مدل) زمانی با ارزش و مهم خواهد بود که مقدار زیادی از تغييرات را به وسيلة تعداد کمی از متفیرها بتوان توضیح داد. قابليت ت براى مجموعه داده های معین, بارامترهاى تخمين زده شده بايد مقادير منحصر بفردى ات تنها یک تخمین برای هر پارامتر مشخص به دست ۲ خوبی برازش: سا زگاری با تثورى قدرت تعمیم دهی و پیشنگری: تنها آزمون مناسب برای اعتبار یک فرضیه (مدل) مقایسة پیش بینی آنها تخاب اسنت:

صفحه 274:
انواع خطای تصریح وارد کردن متغیر غیرلازم ۳ درنظر كرفتن يك شكل تبعى خطای در اندازه گیری

صفحه 275:
نتايج خطاى تصريح حذف يك متغير مهم: - ضرایب رگرسیون اشتباه بر اه تخمین زده می شود. أ فاصلة اطمينان و آزمون فرضيه نتايج گمراه کننده ای را راجع به معنادار بودن آماری پارامترهای تخمین زده شده به دست می دهند. * لحاظ کردن یک متفیر نامربوط - تخمینها ناتور و ناسا ز گارند انس خطا درست بررآورد می شود. رد می شوند (تورشدار, ناسا زگار) و - آزمون فرضيه و فاصلة اعتماد معتبر مى باشند. - به طور کلی ضرایب بر آوردشده غیر کارا هستند یعنی واریانس آنها عموماً بزر گتر از واریانسهای ضرایب حقیقی می باشند. (دقت کم در استنتاجهای احتمالیپارمترها) (احتمال ایجادشدن مشکل همخطی را نیز زیاد می کند) (درجة آزادی را کم می کند)

صفحه 276:
آزمونهای کشف خطای تصریح * کشف وجود متفیرهای غیرلازم - آزمون معنادار بودن ضریب متغیر اضافه (آزمون ۴ * آزمونهای راجع به متغیرهای حذف شده و شکل تبعی غلط - استفاده از بآقیمانده ها (ملاحظة گرافیک این باقیمانده ها) - آزمون اتح) رمزی - آزمون نسبت راستنمایی = آزمون والد - آزمون ضریب لاگرانژ - آزمون هاسمن

صفحه 277:
استفاده از باقیمانده‌ها (ملاحظهٌ گرافیک این باقیمانده‌ها) 0 iy 8 ouput Residuals @ 0 0 Residuals 0 from (a) linear, (b) quadratic, and (c) cubic total cost functions.

صفحه 278:
2 5 5 ر گرسیون بر روی متغیرهای موهومی * در بسيارى از تحليلهاى ركرسيونى؛ متغير وابسته نه تنها تح تتأ تولید. ميزان كود مصرفى....) با مقياسهاى متداول استء بلكه از (جنس نژاده .. متغیرهای (مثل های 82 کیفی نيز تبعيت هى كند. * نظربه اينكه متغيرهاى كيفى عموماً دلالت بر وجود يا عدم وجود كيفيت یا صفتی دارنده لذا يك روش براى كمي كردن ايز صفات.درنظر كرفتن متغيرهاى ساختكى با قبول دو مقدار ضفر و يك مىباشد كه صفر بيانكر عدم وجود لن صفت و يك حاكى از وجود آن مىباشد. به این ترتیب متفیرهایی که اين مقادیر صفر و یک را اختیار می‌کنند؛ متفیرهای موهومی (طاطجه0 برس نام دارند. * اسامی دیگر اين متغیرها عبارتند از متفیرهای دلالت کننده بر یک صفت. متغفیرهای دوتایی؛ متغیرهای طبقه‌ای متفیرهای کیفی؛ متفیرهای منقسم به دو متغيرهاى مجازی.

صفحه 279:
* متفیرهای موهومی به همان سادگی متفیرهای کمی در تحلیل رگرسیونی به ار می‌روند. اگر چنانچه یک مدل رگرسیونی تنها بر حسب متفیرهای توضیحی موهومی یا کیفی بیان شده باشند. آن را مدل آنالیز واریانس می‌نامند. در بیشتر تحقیقات اقتصادی. معمولا یک مدل رگرسیون شامل چندین متغیر توضیحی مي‌باشد که تعدادی از آنها کمی و بقیه کیفی می‌باشند. این گونه مدل‌های ر گرسیونی که شا د فرع ‎ln‏ کمی و کیفی هستند را مدل‌های آنالیز کوواریانس (۷ 6/6 می‌نامند. قاعدة کلی برای تعداد متغیرهای موهومی: چنانچه متغیر کیفی موردنظر دارای طبقه باشد؛ آنگاه بایستی فقط به تعداد 111-1 متغیر موهومی در مدل منظور شود در غیر اینصورت در دام متیر موهومی گرفتار خواهیم شد (همان حالت ایجاد همخطی کامل بین متغیرهای موهومی)

صفحه 280:
رگرسیون بر روی یک متغیر کمی و یک متغیر کیفی با یش از دو طبقه پیش بینی تلفات برداشت گندم و تحلیل داده ها به روش مدل متفیرهای موهومی (کد مقاله ۵۲ع) احسان مصدری[۱]؛ محمد حسین عدالت|[۲] ۰ محمد جواد غلیلی[۳] : حمید طاهرپور کلاتری[1] مجموعه مقالات پنجمین کنگرهٌ ملی مهندسی ماشین‌های کشاوزی و مکانیزاسیون

صفحه 281:
مدل متغیرهای موهومی گونه ای از مدل های رگرسیونی است که بوسیله تن مي توان اثر متفیرهای کیفی را بر روی متغیر وابسته سنجید. این مدل ها مي توانند فقط از متغیرهای موهومی (کیفی) تشکیل شده باشد که در این صورت ‎OT‏ را مدل آنالیز واربانس می نامند و یا می تولند تر کیبی از متفیرهای موهومی و کمی باشد که در اين ‎OT‏ را مدل آنالیز کوواریانس می امند. های کیفی را بایستی با استفاده از روش مناسب به صورت صفر و ‎che‏ تخمين مدل در اين مطالعه از یک تابع خطی به شکل زیر استفاده كه در ان نشان دهنده متغيرهاى مستقل و نشان دهنده متغير وابسته و مقادير و ضرلیبی است که در پی زدن هستيم. اين مدل با استفاده از روش ‎OLS‏ به راحتی قلبل تخمین است .اما شیوه تفسیر ضرلیب متفیرهای موهومی متفاوت خواهد بود. متفیرهای مستقل وارد شده در لین مدل جهت تخمین رابطه ریزش شامل منطقه واریته گندم؛ مدل کمبایین: نوع کشت؛ ؛ عملكرد؛ عصر کمباین؛ تاریخ برداشت و سافت برداشت می‌باشد. متنیر وابسته درصد ریزش است که حاصل جمع ربزش عملیات برداشت و ریزش طبیعی محصول می‌باشد.

صفحه 282:
2 + ‏رنیرت +9292 2 نآ یروق کرو | 3 قآ رروروق/‎ 05/02 B sradaySAAAL, | yyogegM OE Bn ¢ ODF Bry yp TATIKEt ‏كرريع أ‎ *_متنیر منطقه دارای چهار حللت مشهد. تربت جاءء خواف و تایباد می باشد كه از لين ميان منطقه مشهد به عنوان وضعیت پلیه التخاب شده و سایر مناطق به ترتیب با متغير هاى 1662 :10۳۳2102۳0 و 0 وارد الگومی شود. در لین صورت چنانچه مقادیر هر سه ناحیه برابر صفر باشد نشان دهنده شهرستان مشهد اگر متفیر 1011021[210 برابر یک باشد و سایر متفیرها صفر باشند نشان دهنده تربت جام و اگر متفیر 1108 برابر یک باشد و سایر متفیرها صفر باشد نشان دهنده شهرستان خواف و در نهلیت اگر متفیر 121020 برابر با یک و سایر متفیر ها صفر باشد نشان دهنده شهرستان تایباد خواهد بود. ساده شر پرای هر شهرستان بیک متغير كيفى تعريف شده است كه مقدار يكء نشان دهنده تان و مقدار صفر نشان دهنده برداشت در یک شهرستاد ن دیگر می باشد. برای هر مشاهده حداکثر یک متفیر برابر با یک می شود و سایر مناطق صفر است. همانطور که قبلا گفته شد اگر مقدار هر سه متفیر صفر باشد نشان دهنده شهرستان پایه یمنی مشهد است.

صفحه 283:
* به همین ترتیب برای واریته گندم که شامل چهار رقم فلات؛ روشن. سرداری و گاسکوژن است: ‎le‏ ‏فلات به عنوان واریته پایه انتخاب شده و ارقام روشن؛ سرداری و گاسکوژن به وسیله متفیرهای کیفی 550337 : طقط1805 و هه زمكاكة6 وارد الكو شده است. مدل های کمباین شامل جاندیر و سهند 06 است که‌به وسیله یک متفیر کیفی با نام ۷10061 وارد الگو شده است. مقدار یک نشان دهنده استفاده از کمبلین جاندیر و مقدار صفر نشان دهنده کمبلین 500) است. نوع کشت شامل دو وضیت آبی و دیم است که به وسیله متفیر ۸30637۳0 مشعص شده است مقدار یک نشان دهنده کشت یی و مقدار صفر نشان دهنده کشت دیم است. * به این ترتیب متفیرهای مستقل کیفی شامل منطقه؛ واريته كندم؛ نوع كشت و مدل كمباين وارد الگو مىشوندء ساير متغيرها شامل عمر كمبلين؛ تاریخ برداشت و ساعت برداشت متفیرهای کمی هستند که به ترتیب با نام های ۰5۵21 ‎Omr . Tarikh‏ معرفی می‌شوند. متفیر 0010۳ برحسب سال؛ متفیر 181116 برحسب شماره روز از ابتدای سال ۸۴ و متفیر ‎٩801‏ برحسب فاصله زمانی از ساعت ۱۲ شب که مقداری بین صفر تا یک می باشد در نظر گرفته شده است. معنی‌داری کلی رگرسیونی با استفاده از آزمون ۳ و معنی داری ضرایب با استفاده از آزمون ! بررسی می‌شود.

صفحه 284:
رگرسیون بر روی متغیر وابستةٌ موهومی * در مدل‌های رگرسیونی دارای متفیر موهومیء این فرض ضمنی وجود داشت كه متغیرهای توضیحی می‌توانند کمی» کیفی یا ترکیبی از آن دو باشند. در حالیکه متغیر به هر حال بایستی قابل اندازه گیری کمی باشد. * در این قسمت مدل‌های رگرسیونی مورد نظر قرار می‌گیرند که در آنها متفیر وابسته یا تلبع: خود ماهیتاً بیانگر دو گروه است که هر یک مقادیر ۰ و ۱ را اختیار می‌کنند.

صفحه 285:
WN :عموما برای تخمین این مدل‌ها سه روش وجود دارد linear probability model (LPM) (b+ ‏مدل احتمال‎ .١ ‏؟. مدل لاجيت (00116.آ)‎ (Probit) ‏مدل پروبیت‎ .*

صفحه 286:
مدل‌های معادلات همزمان

صفحه 287:
بسيارى از رولبط آمارى .به وسيلة مدل‌های تک معادله‌ای قلبل تبیین هستند. در لین مدل‌ها يك متغير (متغير وابسته) به عنوان تابعى خطى ازيك بیا چند متفیر ديكر (متغيرهاى توضيحى) درنظر كرفته مىشوند..به لين ترتيب.به طور ضمنى فرض بر لين است كه رابطة على (درصورت وجود بين دو متغير > و /ا يكطرفه می‌باشد یعنی متفیرهای توضیحی حکم علت و متغیر وابسته حکم معلول را دارا می‌باشد. ‎asia Ul‏ وجود دارد ‎iS‏ جريلتى دوطیفه از رابطة على يين متغيرها مواجهيم یعنی ییک متفیر در عين تأثي ركذارى بر متفیر(های) دیگر از كن (آنها) نيز تأثیر می‌پذیرد. بدیهی است در این حالت: تحلیل ركرسيونى قبل ‎(CLE)‏ براق مطالعة چنین وضعی مناسب نخواهد بود جرا كه دو متغير متقابلاً بهم وابستهاند. به عبارت دیگر در لین حللت به دو معادله احتياج خواهیم داشت و همین ضرورت است که ما را متوجه مبحث معادلات همزمان می کند.

صفحه 288:
اگر در لین حللت از سایر معادلات در سیستم چشم‌پوشی نماییم و پارامترهای هر معادله رابه وسیلة روشی مانند حدلقل مربعات معمولی تخمین بزنیم» این تخمین‌ها نه تنها تورشدار بلکه ناساز گار نیز خواهند بود چون یکی از فروض قاطع روش ‎OLS‏ « داشتن توزیع مستقل متغیرهای توضیحی از جزء اخلال استو کاستیک است که در معادلات همزمان نقض می‌شود. در این حالت از روش‌های زیر استفاده می‌شود: - روش حداقل مربعات دو مرحله (251) - روش حداقل مربعات سه‌مرحله‌ای (351.5) — روش حداقل مربعات سه مرحله‌ای تکراری (1351,5) < روش حداکثر راستنمایی * روش حداکثر راستنمایی با اطلاعات محدود (11) * روش سیستمی حداکثر راستنمایی با اطلاعات ‎CFIML) pis‏

صفحه 289:
در حوزهٌ مطالعات اجتماعی و اقتصادی؛ روشهای تحلیل چندمتفیرة زیادی وجود دارند که به بررسی اثرات و روابط بین متغیرهای مورد مطالعه می‌پردازند. این روشها عمدتا اثرات مستقیم یک متغیر بر متفیر دیگر را مورد بررسی قرار می‌دهد. اما در این میان تحلیل مسیر از جمله تکنیکهای چندمتغیره است که علاوه بر بررسی اثرات مستقیم متفیرهای مستقل بر متفسر وابسته؛ اثرات غيرمستقيم اين متغيرها را نیز مدنظر قرار می‌دهد و روابط بین متغیرها را مطابق با واقعیتهای موجود در تحلیل وارد می‌کند و با بیان منطقی: روابط و همبستگی مشاهده‌شدةٌ بين آنها را تفسير مى كند.

صفحه 290:
خاستگاه تحلیل مسیر abl dew sf Geel Oright bos ° Corwuhted ta sertes oP pupers published in dd, 4990, 996, 0 © برای استخراج اثرات مستقیم و غیرمستقيم در بین متغیرها ایجاد شد. ‎٠‏ تحليل مسير با ارتباطات تبعی در پین متفیرها سرو کار دارد.

صفحه 291:
اصل اساسی موردنظر در تحلیل مسیر این است که هر ضریب همبستگی بین دو متغیر را می‌توان به مجموعه‌ای از مسیرها تجزیه کرد. استفاده از تکنیک تحلیل مسیر مستلزم قبول پیش‌فرضی است مبنی بر اينكه روابط بین متغیرهایی که حداقل در مقیاس شبه‌فاصله‌ای هستند به طور خطی با افزایش متفیرها اضافه می‌گردد. هر متفیر وابسته بر اساس اثرات متفیرهای قبلی در دیاگرام مسیر و متفیر باقیمانده مورد تحلیل و تبيين قرار مى كيرد.

صفحه 292:
تجزیه همبستگی * همبستگی - اثرات مستقیم + اثرات غیرمستقیم

صفحه 293:
برای ساختن یک مدل در بحث تحلیل مسیرء ده شرط مطرح شده است کهبه کمک آنهاء امکان تجزیه و تحليل على فراهم مىكردد. درده شرط موردبحث هضت شرط اول مدل تلوریکی مناسبی را برای تجزیه و تحلیل و استتاج ‎le‏ فراهم می‌سازد: بیان رسمی تئوری در قالب مدل ساختاری وجود منطق تئوریکی برای فرضيههاى علّى معین‌نمودن نظم علی مشخص‌نمودن جهت روابط ‎de‏ نوشتن معادلات توابع مشخص‌نمودن مرزهای مدل ثبات مدل ساختاری عملياتى كردن متغيرها تأييد تجربى معادلات كا ركردى ۰ برازش مدل ساختاری با داده‌های تجربی مد 4 ‎yd we‏ جا از مد

صفحه 294:
درتحلیل مسیریبه منظور بررسی رولبط علت و معلیلی بین متغیرها لازم است برای عینی شدن آنها و جلو گیری ازبروز اشتباهات» ازنمودارهای مسیری استفاده نمودکه این کار را می‌توان طی مراحل زیرنشان داد: الف - تعیین متغفیرها: پیش از هرچیز باید هریک از متفیرهای مورد بررسی به لحاظ نقشی که در سیستم ایفا می‌نماینده مشخص شده باشند. ازاين نظر دو نوع متغیر وجوددارد: متغیربرونزا: به متفیرهایی از مجموعة متغیرهای مورد بررسی اطلاق مى كردد كه تحت تأثير ساير متغيرها قرار نداشته باشند. متغیرهای‌درونزا: به متغیرهایسی ازمجموعه متفیرهای موردبررسی اطلاق می‌گردد که تحت‌تا ثیر یک یا چند متغیر دیگر قرارداشته باشند.

صفحه 295:
انواع مدل‌های مسیری در تحلیل مسیری با دو نوع مدل سرو کار داریم ‎ST)‏ ۱۳۸۰): ۱- مدلهای باز گشتی: به مدلهلیی گفته مى شود كه در بين هيح یک از متغیرهای مورد بررسی, رابطةٌ دوطرفه پا متقلبل وجود نداشته باشد. ۲- مدلهای‌غیر باز گشتی: یعنی مدلهلیی که در آنها رابطة بين برخى ازمتغیرها به صورت دوطرفه باشد.

صفحه 296:
مدل‌های مسیری باز گشتی ارتباطات علی یکطرفه می‌باشند. @®—-@—-@ eS (وه)--- وهای

صفحه 297:
مدل غیرباز گشتی ارتباطات علی دوطر فه هستند 0ك Cx) ©) > +

صفحه 298:
معنی مدل‌های مسیری ‎s‏ فرض بر این است که مدل‌های مسیری نشاندهندهٌ فرضیه‌های علی می‌باشند. * یک مدل مسیری معنی‌دار به معنی علیت نمی‌باشد. - بلکه با استفاده از داده‌های تجربی از یک مدل برای آزمون علیت استفاده نمود.

صفحه 299:
اثرات غير مستقيم و مستقیم 1 دو راهی که یک متفیر پیش‌بینی کننده ممکن است بر یک منغير واكنش تأثير بكذارد. * اول یک اثر مستقیم متفیر « بر روی متغیر ۷ xv . دوم يك لذ یر ‎ER Bl SY 09 i oe‏ اكنندة ديكر.

صفحه 300:
نمودا ر مسیر درونداد در مطالعةٌ رضایت شغلی 59 ey ۳ Py Py ‏ايت شخ‎

صفحه 301:
ماتریس همیستگی رضایت شغلی درآمد خودفرمانی درآمد 376 .733 35 1.000 627 374 1.000 35 280 1000 374

صفحه 302:
رضایت شغلی Mean Square 22.854 317 MULTIPLE REGRESSION Equation Number 1 Dependent Variable. ntered on Step Number Variable(s 1 ‏درآمد‎ ‎2. . ‏خودفرماتی‎ ‎Bs ‏سن‎ Multiple R R Square Adjusted R Square Standard Error Regression Residual F = 72.083 Beta 1 Prob AGS 6.213.000 ‏0و5‎ 9.492.000 -080 -1.099 75 832 ‏دوم‎ ‎683 ‎563 ‎Analysis of Variance DF Sum of Squares 3 68.563 96 30.437 Prob = .000 B SEB 468 075 0 061 =080 073 Variable ways خودفرمانی سن

صفحه 303:
* _بنابر آنچه گفته شد. بيكانها نشاندهندةٌ پیوندهای علی مورد انتظار بین متفیرهاست اين مدل از جب به راست حركت مى كند تا از حجيت على متغيرهائى را كه به جب نزدیک تر هستند را منعکس سازد؛ هر معرف نماد یک مسیر علی و بنابراین یک ضریپ قير أبنت كه باید محاسبه شود. بر بايه ابن مدل ملاحظه مى كنيم که: - سن بر رضايت شغلى هم اثر مستقيم (80) ) و هم اثر غيرمستقيم دارد. - سن به كونه مستقيم بر درآمد اثر مىكذارد (©8) كه به نوبه خود در رضايت اثر دارد ‎PO)‏ و بر خردفرعلی نيز اثر مي كذارد (6۳62) که خود بر در آمداثر مستقیمدارد( @ و به نوبه خود رضایت را زیر نفوذ قرار مىدهد (©6). - علاوه براینه خودفرمانی نیز بر رضایت شغلي هم اثر مستقیم (6۳6): هم از طریق تأثیر بر درآمد (805)) بر آن اثر غير 0 ‎١‏ - سرانجام در آمد بر رضايت اثر مستقيم دارد (©6) اما بر آن اثر غيرمستقيم ندارد.

صفحه 304:
مشاهده می‌شود کوردرآمده ‎dla bape‏ و رضلیت شنا ۱ آن متفيرهاست كه مستقيم به آنها وصل شدائد لين بيكانها معرف واريلنس تبيين نشده براى هر متغير می‌باشند بتابرلين بيكان تبه خودفرملنى (820) بياتكر مقدار واریانس خوذفرمانی است که از سوی سنن» تین نمی‌شود پیکان ©صبه رضليت شفلى (©)) معرف مقدارى از شغلی است که از سوى سن» آمد توجیه نمی‌شود. سرانجام پیکان 6 عبه درآمد (06) معرف مقداری از واریلنس در آمد است که از سوی سن و خودفرمانی تين تله اسح ابن سه جملة خطا نشاندهندةٌ ابن واقعيت است كه متفیرهای دیگری وجود دارند که بر خودفرمانی و درآمد و رضابت شغلی اثر دارند اما در این نمودار هسیر گنجانده نشده اس

صفحه 305:
تحليل مسير اساساً با بر آورد مقدار اتصالات پین متفیرها و کاربرد این بر آوردها به منظور بدست آوردن اطلاعاتی دربارٌ فرایندهای علی زير: هرچند این برآوردها را می‌توان از طریق روشهای گوناگونی بدست آورد اما ساده‌ترین راه برای محاسبة آنهاء كاربرد روش ركرسيون معمولی است مشروط بر آسن كه مفروضدهاى ركرسيون بهويزه اين مفروضه كه متغيير يس.ماند در معادلة ساختاری با متغیرهای تبیین کننده در آن معادله ناهمبسته است برقرار باشد برای بدست آوردن برآوردهای ضرائب اصلی مسیر کافی است هر متفیر وابسته (درونزا) به متغیرهائی که مستقیماً تحت تأثیر آن است بازگشت داده شود. به بیان دیگر برای بر آوردهای هر یک از مسیرهای مشخعص شده. ضرائب استانداردشده رگرسیون (یا ضرائب مسیر) محاسبه می‌شود. این ضرائب از طریق برقراری معادله‌های ساختاری یعنی معادلههائی که ساختار روابط مفروض در ائی سرو کار دارد. یک مدل را مشخص مىسازد به دست مى 1 ب

صفحه 306:
ب. برای نمودار مسیر شکل لازم است سه معادله ساختاری» یکی برای خودفرمانی؛ یکی برای رضایت شغلی و یکی برای درآمد (هر یک به عنوان متفیر وابسته و متفیرهائی که در معادله آمده به عنوان متفیر وابسته) محاسبه شود. ‎Gin A‏ < خودفرملنی © انك + (درآمد) ن»+ (خودفرملنىع ن»<+ (سيى ,< - يضليتشغلى ‎aT pam GH) +x (des)+ eg ©‏ ‎ ‎

صفحه 307:
40 رآمد) ریک + (خودفرملني) + ‎fH)‏ لي + (خودفرملئي) ‎UT =m Gn) +m‏ ضریب استاندارد برای سن در معادله (۱) مقدار ای: ضرائب سن؛ خودفرمانی و درآمد در معادله (۲) به ترتیب مقادیر ۳و ۰ طوو و؛ و سرانجام ضرائب سن و خودفرمانی در معادله (۳) به ترتیب مقادیر "اي ور رابه دست می دهد. بنابراین به منظور محاسبه ضرایب مسی ضرورت دارد سه معادله را به عنوان معادلههای ر گرسیون چندمتفیری در نظر بگیریم و ضرائب حاصل از آنها ضرائب سیر را ب‌دست می‌دهد..

صفحه 308:
* . از مقادیر عرض از مبدأ در هر مورد صرفنظر و سه جمله خطا از طريق ريشه دوم 7۳ -عاسبه می‌شود. * بايد توجه داشت كه جون به منظور تكميل مسيرها لازم است همه ضرائب مسير محاسبه شود بنابراين نبايد از روش ركرسيون كام به كام استفاده شود.

صفحه 309:
Analysis of Variance DF Sum of Squares. Mean Square Regression 2 43.150 21.575 Residual 9 55.850 516 F= 37471 Prob = 000 — Variables in the Equation Variable Bo OSEB ‏سيم‎ T Prob ‏مود كله 79م كلك خودفرمانی‎ 008 0 ترد م 9 70د شن ‎(Constant) 00 00 0‏ برای مثال» بر پایه تحلیل رگرسیون معادله سوم ضرايب استانداردشده براى خودفرمانى با ۰,۴۳۱ است, برابربا ۰,۲۱۵ و ۰,۵۱۷ و مقدار ۸۲ aoe ‏برای ۰0۴ 9۵ و 94 در نمودار مسیر خواهیم داشت:‎ 7۴-۰۵ py =9/ OW pa VV 2 FRI =0/¥O

صفحه 310:

صفحه 311:
چون ضرلیب مسیر ضرلیب استاندارد هستند» لین امکان وجود دارد که آنها رابه گین؛ مستقیم با هم مقایسه کنیم. می‌توان دید که سن اثر مستقیم اما بسیار کوچک و منفی در رضایت شغلی دارد در حالیکه لشر غیرمستقیم آن مثبت و قابل توجه است.

صفحه 312:
بسیاری از پژوهشگران مایلند لثر کلی یک متفیر را بر متفیر دیگر محاسبه کنند برای مثال لثر كلي سن بر رضليت شغلى از طربيق جمع لثر مستقيم ‎Ne)‏ -) با مجموع آثار غيرمستقيم آن.به دست می‌آید. آثار غیرمستقیم آز طرییق حاصلضرب ضرلئب هر مسی سن به رضایت شغلی به طریق زیر محاسبه می‌شود: برای مسیرهای سن به درآمد به رضایت شغلی ۲۷/۰ - (۴۷/۰ *۵۷/۰) پرای مسیرهای سن به خودفرمانی به رضایت شغلی ۱۶/۰ < (۵۸/۰ * ۲۸/۰) برای مسیرهای سن به خودفرمانی به درآمد به رضایت شعلی ۰۳/۰ - (۲۷/۰ ۲۲/۰۶ ۲۸/۰) اين جمع آثار عیرمستقیم سن بر رضایت شغلی ۲۶/۰ - ۰۳/۰ + ۱۶/۰ + ۲۷/۰ می‌باشد. و براى لثر كلى سن بر رضليت شغلى بليد لثر مستقيم لَن راجا كل آثار غيرمستقيم ن جمع کنیم که حاصل آن برابر با ‎١8/٠ + ؟ع/٠ - 58/٠‏ - خواهد بود. لين تمرين نشان داد كه لثر غيرمستقيم سن بر وضليت هماهتك .با لثر مستقيم آن نزديك به صفر و اثر غيرمستقيم آن مثبت است.

صفحه 313:
خودفرمانی ماهیت کار

صفحه 314:
برعل ارقاح بهت عل ين مبدمصيريها راادز تمودار متیر جمی‌توآن:ج در شکل مشاهده می‌شود خودفرمانی و ماهیت کار همبسته‌انده یعنی دیگری وجود ندارد: و اتضال بین آنها به وسیله یک پیکان دوسره نشان داده شده است. هر متفیر دارای یک لثر مستقیم (۳6) و ۳6۴), ویک لثر غیرمستقیم بر غیبت از طریق رضلیت شفلی است: خودفرمانی به رضایت (۳0)) و رضلیت به غیبت (۳60))؛ ماهیت کاربه رضلیت (4*6) و رضلیت به غیبت (6*).به منظور ضرلیب محاسبه ضرلیب لازم؛ نیز به ضریب ۲ پیرسون برای خودفرمانی و ماهیت کار و نیز : استانداردشده دو معادله زیر داریم: ‎my LEAL) + By‏ (خودفرملنی) 5 + ,ده یضلیت ج9 + (یضلیکن»< + (ماهیتکار) رد + (خودفرملنی) ,6< « غیبت ‎

صفحه 315:
پس از لن می‌توانیم کل آثار علی را هم برای متفیرهای خودفرمانی و ماهیت کار؛ و هم برای رضلیت محاسبه وبا هم مقایسه کنیم. لثر کلی هر تولند از جمع لثر مستقیم.با کل آثار غیرمستقیم تشکیل شود. اثر کلی لین سه متفیر بر غیبت عبارت است از: (,0,()0) +(,0) - اثر کلی خودفرمانی (,0:()0) +(,0) -اثر کلی ماهیت کار ,0- اثر کلی رضایت شغلی

صفحه 316:
مدل غیربا زگشتی KD

صفحه 317:
> تفسیر ارتباطات - ولابازگشتیو علی‌ولبسته بسه چد میساشد - وا ممکزلستده طور غیرمستقیم از طریقمبه م8 ولبسته باشد - م0 سمکزاستبسه طور غیرمستقیم از طریق, به م8 ولبسته باشد | مع ممکزلستسه جع ولبسته بساشاء * اگر این وضعیت وجود داشته باشد ... - فروض )ما نقض می‌شوند. در رگرسیون به روش 2 فرض بر ايت است که ارتباطات یکطرفه بوده و جملات خطا از یکدیگر مستقل می‌باشند.

صفحه 318:
در اینحالت باید از روش ,060 یا روش حداقل مربعات دومر حله‌ای استفاده نمود.

صفحه 319:
تحلیل عاملی Puvtor Oualsis

صفحه 320:
تحلیل عاملی از تعدادی فنون آماری تر کیب شده و هدف آن ساده تر کردن مجموعه‌های پیچيده داده‌هاست

صفحه 321:
5 111 1 cd 7 ۸ TN 2/۳ “Ok oA 504 2/۳۳ 3 1۳۸ ۸ 7۵ ‎geet‏ همبستگی مجموعه‌ای از ضرایب تعدادی از متفیرها است: ‎ ‎AN‏ فرض بر لین است که هر متفیر یا خودش همیستگی کامل دارد(عناصری که در ‎ ‏83 2 | 581 | همبستگی ری ار 0 ‎we‏ ‏& در فهم و تفسیر تحلیل‌های عاملی مهم ف ۷ اه اهستيد). ‎ae ne‏ | 2 زواید زیادی در ماتریس وجود دارد؛ بدين مت سوه ما که هر شریپ دوبار در ماتریس ‎eee 2 ie‏ ‎pase ay yoo Jue ‎i 57 7 2/41‏ املی برای کر ~~ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎ ‎

صفحه 322:
تعریف عاهل: اساساً علمل. بعد یا سازه‌ای است که رولبط بین مجموعه‌ای مطرح می‌کند پنابه عقیدٌ رویس ‎NET)‏ عامل» سازه‌ای است که عملاً از روی (یا بوسیلذ) بارهای رها رابه صورت خلاصه عاملی‌اش تعریف می‌شود. تعریف بارهای عاملی: همبستگی میک متفیربا ب عامل را بار عاملی گویند. فرض کنید کجموعه‌ای از آزمون‌های توانلیی و پیشرفت تحصیلی را تحلیل عاملی کرده‌ايم. لین مثال؛ سه علمل را در یک نوع تحلیل عاملی از تواناییها نشان می‌دهد. عاملهای ی نیز ممکن است وجود داشته باشد لما اینها ماهیت عوامل و بارهای عاملی را بهتر توضیح فى ده فرانسه عامل ۱ ۸/۰ ۷۸/۰ ۳/۰ ۷۵/۰ 1۹/۰ عامل ؟ ۶2۳/۰ role 2/۰ ۶۸/۰ 1۳/۰ Me عامل۳ 1۹/۰ ave ۳/۳۰ Wie ۱/۰ Bele

صفحه 323:
فایده تحلیل عاملی ‎pes 8‏ اینکه می‌دانيم تحلیل عاملی برای خلاصه کردن ماتریس‌های همپستگیبه یه کار برده می‌شود» هنوزبیک موال مهم بلقی است و آن این است که با تحلیل عاملی چه کارهلیی را می‌توان انجام داد و لین فن چگونه می‌تواند سودمند واقع گردد؟ ‏* برای پاسخ‌به لین پرسش, بلیدبه لین نکته توجه کرد که هنگام کاربرد اين روش بايد بين تحليل ‎weet » (exploratory) gles!‏ ‎»ls (confirmatory)‏ قائل شد.

صفحه 324:
تحلیل عاملی اکتشافی: یک مثال هدف از تحلیل عاملی ‎ALES‏ بررسی يك حوزه (8610) براى كشف ابعاد یا سازه‌های اصلی آن حوزه است.به همین علت بود که اسپیرمن ‎)۱٩۰۲(‏ تحلیل عاملی را در حوزه توانیبهای انسان بوجود آورد. او سعى كرد به اين سؤال كه جرا بين توانایبهای انسان هميشه همبستگی مثبتی وجود دارد پاسخ دهد. (در تحلیل عاملی توانای‌هاء لین موضوع صورتبندی مثبت نامیده می‌شود بلین معنا که تمام هتبتك فاق ‎Sul et Seah ei ale‏ به طور کلی در تحلیل عاملی اکتشافی» قاعده بر این است که محققان تا حدامکان متغیرهای بسیاری را وارد تحلیل کنند تا پینند کدام یک از آنها روی عامل موردنظر بار عاملی دارند

صفحه 325:
تحلیل عاملی تأییدی * در ابتدا تحلیل عاملی صرفًیک روش آماری اکتشلفی بود لما اخیراً این امکان بوجود آمده که جا استفاده از تحلیل عاملی؛ فرض آزملیی کرد. لین روش كه بوسيلة يورس کوگ (۱۹۲۳) ابداع شده؛ تحلیل تأییدی نامیده می‌شود.

صفحه 326:
اشکالات وارده بر تحلیل عاملی ايراد اصلى وارد بر تحلیل عاملی این است که بینهایت راه حل ریاضی معادل وجود دارد. تحلیل گران عاملی غاباً در تعیین مهمترین علامت‌های یک حوزه با هم اختلاف دارند. تکرار تحلیل‌های عاملی دشوار است.

صفحه 327:
انجام تحلیل عاملی یکی از آماره‌هایی که محقق از طریق آن قادر به تعیین و تشخیص مناسب‌بودن داده‌ها برای تحلیل عاملی می‌باشد. آزمون 0 می‌باشد که مقدار آن همواره بین ۰ و ۱ درنوسان است. درصورتیکه مقدار 110 کمتر از ۵/۰ باشد؛ ‎chy Wools‏ تحلیل عاملی مناسب نخواهند بود. اگرمقدار آّن بین ۱۵/۰ ۶۹/۰ باشد. می‌توان با احتیاط بیشتری به تحلیل عاملی پرداخت. اما درصورتیکه مقدار آسن بزرگتر از ۷/۰ باشد» همبستگی‌های موجود در بین داده‌ها برای تحلیل‌عاملی مناسب خواهند بود. ‎Kaiser-Meyer-Olkin‏ ¢

صفحه 328:
دررابطه با حجم نمونه نيز بليد تأكيد كرد كه تعداد نمونه نبليد كمتر از ‎a‏ ‏مورد باشد و ترجيحاً حجم نمونه را بليدبه بيش از ‎٠‏ مورد افزليش داد. اولين تصميم در بكار كيرى تحليل عاملى؛ ؛ محاسبة هاتريس هميستكى است. برای اینکار بلید مشخص شود كه یا هدف. محاسبة همبستكى بين متغیرهاست یا بین پاسخگویان اگر هدف مطالعه تلخیص متفیرها باشد. Z ‏در لین صورت بلید همبستگی بین متغیرها محاسبه شود. لین روش یکی‎ ‏از تکنیکهای عمومی و پر کاربرد در مطالعات می‌باشد که‌به تحلیل عاملی‎ ‏نوع *) معروف است.‎

صفحه 329:
در تحلیل عاملی مدلهای مختلفی وجود دارد كه از ميان آنها دو روش - تحليل مؤلفههاى اصلى - و تحليل عاملى مشترك از يركاربردترين اين روشهاست. مدل تحلیل مژلفه‌های اصلی زمانی مورد استفاده قرار می‌گیرد؛ که هدف محقق تلخیص متغیرها و دستیابی به تعداد محدودی عامل برای اهداف پیش‌بینی باشد.

. آمار مقدماتی و پیشرفته آمار چیست؟ • آمار ب ه عنوان ي ك موضوع علم ي ،امروزه شام ل مفاهي م و روش‌هائ ي اس ت ك ه در تمام پژوهش‌هاي ي ك ه مس تلزم نتيجهگيري به وسيلة تجزيه و تحليل جمعآوري داده‌ها به وسيلة يك فرآيند آزمايش و مشاهده و انجام استنباط و ‌ ‌ اين داده‌ها هستند ،اهميت بسيار دارند. • آمار هنر و علم جمع‌آوري ،تعبير و تجزيه و تحليل داده‌ها و استخراج تعميم‌هاي منطقي در مورد پديده‌هاي تحت بررسي است. • معادل كلم ة آمار در زبان انگليس ي Statisticsاس ت ك ه از لحاظ تاريخ ي ،از كلم ة التي ن statusمشت ق شده و يكي از معاني كلمة اخير ،دولت است. • در طول چندين ده ه ،آمار فقط ب ا بيان اطالعات و مقادي ر عددي دربارة اقتص اد ،جمعي ت شناس ي و اوضاع س ياسي حاكم در يك كشور ،سر و كار داشت. بردارن د و تح ت عناوين ي از • حت ي امروز‌،بس ياري از نشريات و گزارشهاي دولت ي ك ه توده‌اي از آمار و ارقام را در ‌ ميشون د ،معن ي اولي ة كلم ة آمار را در ذه ن زنده مي‌كنند. قبي ل « آمار تولي د مزارع» و «آمار كارگران» منتش ر ‌ سرگيجهآور و ‌ ستونهاي عددي ‌ اكثر افراد معمولي هنوز اين تصور غلط را دربارة آمار دارند كه آن را منحصر به گاهي يك سري شكل‌هاي مبهوت‌كننده مي‌دانند. • بنابراين ،يادآوري اين نكته ضروري است كه نظريه و روش‌هاي جديد آماري ،از حد ساختن جدول‌هاي اعداد و رفتهاند .نمايش‌هاي عددي به صورت جنبه‌اي فرعي از آمار درآمده‌اند. نمودارها بسيار فراتر ‌ ديدگاههاي زير را درمورد آمار بخوانيد. ‌ آيا علم آمار اينگونه است؟ دیدگاه‌هایی در مورد آمار: كسالتآور است. ‌ • تهيه آمار كاري وقت‌گير و زمان بر و اصوالً نمونهاي از آن پيدا مي‌شود. ‌ • آمار گورستاني از اعداد و ارقام است كه در هر اداره و سازمان • آمار مجموعه‌اي از روابط و فرمول‌هاي رياضي پيچيده و گيج‌كننده است. آمار شامل نمودارها و جدولهايي از اعداد است. • آمار فرايندي است كه در آن هر ده سال افرادي را به منازل فرستاده و اطالعات خانوارها مانند تعداد فرزندان ،سن افراد خانوار را از آنها كسب مي‌كنند. • • آمار ابزاري است كه بسياري با توسل به آن افكار عمومي را به نفع خود جلب مي‌كنند. آمار مفهومي است كه براي ثبت و نمايش اطالعات عددي به كار مي‌رود ،مانند تعداد بيكاران ،كارمزد حمل كاال به وسيلة كشتي در 15سال گذشت ه ،جمعي ت نواح ي جنوب شه ر تهران ،تعداد افراد تل ف شده در اث ر شيوع ي ك بيماري ي ا مقدار مس افت ط ي شده در زمان معين ي ب ه وس يلة برندة مسابقة‌ دو. مثال‌هائي از مطالعات آماري: مثالهای زیر ،نشان‌دهندة‍ مواردي نوع ي هستند ك ه در آنه ا ،فراين د كس ب آگاه ي در بررسي ي ك پديده شامل گردآوري و تجزيه و تحليل داده‌هاست و اين خود مستلزم استفاده از روشهاي آماري است. پرورش گياه : • آزماي ش پيوندزدن انواع ي از گياهان ك ه از نظ ر ژنتيك ي متفاوتن د ،به‌ منظور تولي د گياهان پيوندي پ ر محص ول ،مورد عالق ة شدي د متخص صان كشاورزي اس ت .به‌عنوان ي ك مثال س اده ،فرض كني د كه قرار اس ت ميزان محص ول دو نوع گياه پيوندي تح ت آب و هوا و شرايط اقليمي مشخص با هم مقايسه شوند .تنها راه كسب اطالع از ميزان باروري اي ن دو نوع گياه نس بت به‌يكديگ ر عبارت اس ت از پروراندن آنه ا در تعدادي از كرته ا ،گردآوردن داده‌ه ا دربارة ميزان محص ول آنه ا و س پس تجزي ه و تحلي ل داده‌‌هاي مزبور. بيماريها ‌ تشخيص • براي انجام موفقيت‌آميز معالجة بسياري از انواع سرطان با عمل جراحي ،تشخيص بموقع بيماري از اهميت خاصي برخوردار است و از اين‌رو الزم است كه براي انجام معاينات پزشكي مرتب ًا به بيمارستان مراجعه شود .چون مراجعة مرت ب ب ه بيمارس تان و انجام معاينات پزشك ي گران و مشك ل اس ت ،پزشكان در جس تجوي نوع ي روش تشخي ص مؤث ر بيماري هس تند ك ه خود شخ ص بتوان د آ ن را انجام دهد .براي ارزياب ي قابلي ت ي ك روش جدي د تشخي ص بيماري برحس ب درص د موفقي ت آ ن در تشخي ص درس ت موارد بيماري و اجتناب از تشخيص‌هاي اشتباه ،روش مورد نظر بايد روي افراد زيادي آزمايش شود و نتيجه با معاينات بيمارستاني مقايسه شود. ‌ مههاي تربيتي و آموزشي برنا ‌ • برنامه‌اي تربيت ي وآموزش ي ك ه براي انواع متقاضيان (از قبي ل دانشجويان دانشگاه ،كارگران كارخان ه ،گروه‌هاي اقليت ،افراد ناقص‌العضو ،كودكان عقب‌افتاده) در بسياري از زمينه‌ها طرح مي‌شوند ،دائم ًا مورد بررسي ،ارزيابي و اصالح قرار مي‌گيرند تا سودمندي آنها براي جامعه افزايش يابد .براي كسب اطالع از كارائي برنامه‌هاي مختلف موفقيتها يا رشد مهارت افرادي كه برنامه در مورد آنها ‌ در مقايسه با يكديگر ،ضرورت دارد كه داده‌هائي دربارة اجرا مي‌گردد ،گردآوري شود. تحقيقات اجتماعي‌ -اقتصادي: در بس ياري از قلمروهاي جامعه‌شناس ي ،اقتص اد ،علوم س ياسي .مطالعات ي در زمينه‌هاي مربوط ب ه رفاه اقتص ادي گروه‌هاي قوم ي گوناگون .هزينه‌هاي مص رف‌كنندگان در س طوح مختل ف درآم د و نظرات گوناگون در هنگام وض ع ي ك قانون و زمينه‌هاي ي نظير اينه ا انجام مي‌گيرد .اي ن مطالعات نوع ًا بر مبناي داده‌هايي انجام مي‌گيرند كه از راه مصاحبه يا تماس با نمونه‌اي از افراد به‌دست مي‌آيند ،كه اين نمونه به‌وسيلة روشهاي آماري از ك ل جامعه‌اي ك ه قلمرو مطالع ه را تشكيل مي‌ده د ،انتخاب مي‌شوند .س پس اي ن داده‌ه ا مورد تجزي ه و تحليل قرار مي‌گيرن د و تغييرات ي از موضوع مورد نظر به عمل مي‌آيد. بازاريابي: با گسترش صنايع مختلف و بحث بازار رقابتي در قرن بيست و یک بسياري از صنايع به دنبال يافتن روش‌هائي در شناسائي بازار و خواسته‌هاي مشتري ب ه طري ق علم ي گرديده‌اند .نتاي ج حاص ل همواره ب ا اس تفاده از مطالعات آماري روي مشتريان و ي ا مراكزي ك ه مشتري ب ا آنه ا در ارتباط اس ت ص ورت مي‌پذيرد .به‌عنوان مثال ي ك شرك ت توليدكنندة پودر لباس شوئي پ س از تحقيق دربارة ميزان فروش فروشگاه‌هاي ي ك منطق ه س هم فروش پودر ...را درمي‌يابد .پس از اعمال تبليغات جديد و به فاصلة زماني مناسب اين‌كار مجددا صورت گرفته و سهم افزايش فروش بررسي مي‌گردد .و يا در همين مقوله براي كسب اطالع از اينكه در توليد مايع ظرفشوئي آيا از لحاظ مصرف‌كنندگان ،بوي اسانس ليمو با توت‌فرنگي تفاوتي وجود دارد ،از 400نفر مصاحبه مي‌شود كه 145نفربوي اسانس ليمو و بقيه توت‌فرنگي را ترجيح مي‌دهند. كنترل كيفيت: پيشرفتهاي آماري در بخ ش ص نايع بيشت ر مربوط ب ه مس ائل كنترل كيف ي اس ت .اس تفاده از مفهوم آزمون فرض‌هاي آماري در بح ث كنترل حين توليد محصوالت توليدي ،استفاده از روش‌هاي نمونه‌گيري جهت پذيرش براي شناسائي محصول مطابق درخواست با استفاده از يك نمونه از محصول ب ه جاي بازرس ي ص ددرصد و اس تفاده از ابزارهاي س اده آماري در كنترل فرآيند آماري () Statistical Process Control مانن د هيس توگرام ،نمودار پراكن ش ،نمودار ميله‌اي و اس تفاده از بح ث طراح ي آزمايش‌هاي مناس ب و جمع‌آوري اطالعات و بس ياري روش‌هاي آماري كه به صور مختلف مورد استفاده واقع مي‌شوند بخشي از تالش مسئولين كيفي صنايع را به خود اختصاص داده است. آمارشناس‌ها چه می‌کنند؟ گیریها ب ه اندازه‌گیریهای ‌ جهان ب ه س وی کم ی شدن اطالعات پی ش م ی رود .در بس یاری از حرفه‌ه ا و شغل‌ه ا ،تص میم‌ عددی و داده بستگی دارند .داده ها تنها شامل اعداد نیستند ،بلکه اعداد خود حامل اطالعاتی در مورد یک سیستم مشخص هستند و احتیاج دارند که در سیستم مربوطه تفسیر شوند .با توجه به این رشد در استفاده از داده‌ها ،نیاز و آمارشناسهایی که در زمینه‌های زیر کارشناس باشند ،احساس می شود: ‌ تقاضا برای وجود • ارائه و تولید داده‌های قابل اعتماد • تجزیه و تحلیل داده‌ها به منظور روشن و واضح ساختن معنای آنها • دادهها ارائه استنتاج‌های عملی از ‌ آمارشناس‌ها از توانایی‌های کمّ ی ،علم آمار و مهارتهای روابط عمومی و برقراری ارتباط برای حل بسیاری از مشکالت و مس ایل موجود در جامع ه اس تفاده می‌کنند .آمارشناس‌ها در تعیی ن روش‌های نمونه‌گیری و جمع‌آوری داده‌ه ا، نظارت بر اجرای مطالعه ،پردازش داده‌ها و نظر دادن در مورد نتایج مطالعات بدست‌آمده کمک می‌کنند. • فعالیت آمارشناس‌ها در زمینه مطالعه و بررسی نمونه‌ای • فعالی ت آمارشناس‌ها در مراکز دولت ی برخ ی زمینه‌های فعالی ت برای آماری‌ه ا در مراکز دولتی • فعالیت آمارشناس‌ها در زمینه پژوهش‌های علمی • فعالیت آمارشناس‌ها در زمینه صنعت و تجارت زمینههای فعالیت برای آماری‌ها در صنعت و تجارت ‌ • برخی • فعالیت آمارشناس ها در زمینه بهداشت ،پزشکی و سالمت مشخصههای شغلی آمارشناس‌ها ‌ • استفاده از داده‌ها برای حل مشکالت و مسایل • استفاده از دانش ریاضی و آمار خود در حل مشکالت اجتماعی ،اقتصادی ،پزشکی، زیست محیطی ،سیاسی و ... • کارکردن هم به صورت انفرادی و هم به صورت عضوی از یک گروه • اس تفاده از عل م ارتباطات در برقراری رابط ه ب ا متخص صین علوم دیگ ر و مشورت ب ا آنها و ادامه دادن مستمر فعالیتهای آموزشی • گسترش مرزها و قلمرو آمار و احتمال از طریق آموزش و تحقیق سواد آماری چیست؟ سواد آماری یک توانایی/قابلیت است: • توانایی فکر کردن منتقدانه درمورد استدالل‌ها با به کار بردن آمار به عنوان سند یا مدرک • قابلیت خواندن و تفسیر داده‌ها ،قابلیت فهم آنچه که خوانده می‌شود. • توانایی فهم و تفسیر آمارهایی که هر فرد در زندگی روزمره با آنها سروکار دارد. • توانایی استفاده صحیح از آمار توسط همه افراد جامعه گیریها با استفاده از آمار به عنوان سند و مدرک متمرکز شده است ،همانگونه که سوادخواندن و نوشتن بر ‌ سواد آماری ،بر تصمیم‌ استفاده از کلمات به عنوان مدرک متمرکز شده است. سواد آماری بیشتر درمورد سؤاالت است تا جواب ها .سوادآماری جوابهای زیادی ندارد .اما می‌تواند کمک کند تا سؤاالت بهتری تصمیمها و قضاوت‌های بهتری صورت گیرد. ‌ پرسش شود و در نتیجه سواد آماری یک هنر است ،هنر تصمیم‌گرفتن و قضاوت کردن تحت شرایط نامطمئن. با سواد آماری کیست؟ • ب ا س واد آماری کس ی اس ت که قادر باش د تفاوت بین رابط ه معمول ی و رابط ه عل ت و معلولی را از یکدیگر تشخیص دهد. • او کسی است که وقتی با جمالتی همانند جمالت زیر روبرو می‌شود ،درست یا غلط بودن جمله دوم را مدرکی مستند برای درست یا غلط بودن جمله سوم نداند: افرادیکه وزن بیشتری دارند بلندقد‌تر از افرادی هستند که وزن کمتری دارند. ‌ جمله اول: جمله دوم :وزن یک رابطه مثبت با قد دارد. جمله سوم :اگر شما وزن بیشتری بدست آورید ،انتظار می‌رود که قدتان نیز بلندتر شود. نمیتوان نتیجه گرفت که • واضح است که برای بزرگساالن جمله سوم غلط است .اما ‌ اگ ر جمل ه س وم غل ط باش د آنگاه جمل ه دوم نی ز غل ط خواه د بود .درس تی جمل ه دوم مدرکی است برای درستی جمله سوم ،اما درستی جمله دوم برای اثبات درستی جمله سوم کافی نیست. با سواد آماری کیست؟ (ادامه) • . ب ا س واد آماری کس ی اس ت که قادر باش د تفاوت بی ن عبارت “نس بت دادن ی” را از عبارت “نسبت داده شده” تشخیص دهد مثال90درصد خودکشی ها را افراد متاهل مرتکب می شوند .این آمار به افراد متاهل نسبت داده شده است ،اما این بدین معنا نیست که اگر افراد ازدواج نکنند این نسبت کاهش خواهد یافت. • با سواد آماری کسی است که فرق آماری که بر اساس نمونه به دست آمده را از پارامتر جمعیت تشخیص دهد. • باسواد آماری کسی است که بتواند برداشت درستی از درصدها ،میزان ها و نرخ ها داشته باشد مثال :درصد راننده‌ه ا در میان زنان همانن د درص د راننده هایی که زن هس تند ،نیس ت .درص د بیمارانی که نتیج ه آزمایش آنه ا در مورد نوع ی بیماری مثب ت اس ت همانن د درص د افرادی که نتیج ه آزمایش مثب ت دارن د و بیمار هستند ،نیست. شیوه‌های جمع‌آوری اطالعات تعریف هر تیمار (متغیر) تاحد امکان به صورت ویژه کدگذاری برای داده‌های قیاسی یعنی تعیین عدد برای هر طبقه یا دسته. جنسیت زن 1 مرد 2 مشخص کردن روش واحدهای اندازه‌گیری • وزن شما چقدر است؟ (برحسب کیلوگرم ،پوند ،گرم) • دیشب چند ساعت تلویزیون تماشا کردید؟ (ساعت ،دقیقه) نوشتن سؤاالت بدون اریب • ب ا اریب :آیا شم ا موافقی د که افزایش مص رف کود باعث کاهش عملکرد می‌شود؟ • بدون اریب :نظ ر شم ا در مورد مصرف کود بر عملکرد محصول چیست؟ سؤاالت خود را در یک مطالعة پیلوت قبل از انجام مطالعة اصلی امتحان نمایید • ( 8تا 10مورد یا واحد از افراد ،دانش‌آموزان ،درختان و )... انواع داده‌ها انواع داده‌ها • داده‌های قیاسی داده‌های معیاری داده‌های قیاسی • موضوعات و صفات مورد بررسی به طبقاتی بر اساس بعضی از صفات کیفی گروه‌بندی می‌شوند. مثال :داده‌های قیاسی • رنگ مو – بلوند ،قهوه‌ای ،قرمز ،سیاه ،غیره • نظر دانشجویان در مورد نحوة تدریس – ناراحت ،خنثی ،خوشحال • وضعیت سیگارکشیدن – سیگاری ،غیرسیگاری طبقه‌بندی داده‌های قیاسی به صورت: اسمی ،ترتیبی و دوتایی داده‌های قیاسی داده‌های ترتیبی غیردودویی داده‌های اسمی دودویی غیردودویی دودویی داده‌های اسمی یک نوع از داده‌های قیاسی است که صفات در طبقه‌های غیرمرتب قرار می‌گیرند. مثال :داده‌های اسمی • رنگ مو – بلوند ،قهوه‌ای ،مشکی ،قرمز ،غیره • نژاد – هندی‌،افریقایی ،آمریکایی ،غیره داده‌های ترتیبی نوعی از داده‌های قیاسی می‌باشند که رتبة آنها مهم است مثال :داده‌های ترتیبی • طبقه – خیلی کم ،کم ،متوسط ،زیاد ،خیلی زیاد • شدت بیماری • نظر دانشجویان دربارة‌ درس داده‌های دودویی • شکلی از داده‌های قیاسی که تنها دارای دو طبقه هستند. • داده‌های دودویی می‌توانند یا اسمی یا ترتیبی باشند. مثال :داده‌های دودویی • وضعیت سیگاری بودن – سیگاری ،غیرسیگاری • حضور – حاضر ،غایب داده‌های سنجشی • اهداف مورد مطالعه بر اساس بعضی از صفات کمی قابل اندازه‌گیری می‌باشند. • داده‌ها به صورت اعداد می‌باشند. مثال :داده‌های سنجشی • • • • • • سطح کلسترول قد سن میزان عملکرد تعداد دانشجویانی که درکالس دیر حاضر می‌شوند. زمان الزم برای انجام تکالیف درسی در منزل داده‌‌های سنجشی تقسیم می‌شوند به گسسته یا پیوسته ‏Discrete or Continuous داده‌های سنجشی پیوسته گسسته داده‌های سنجشی گسسته تنها مقادیر معینی را خواهند داشت (شکافی بین مقادیر ممکن وجود دارد) داده‌های سنجشی پیوسته از نظر تئوریک ،هر مقداری در درون یک فاصله را می‌توان با ابزارهای اندازه‌گیری دقیق محاسبه نمود. داده‌های گسسته -شکاف بین مقادیر ممکن 5 4 3 2 0 1 7 6 داده‌های پیوسته -از نظر تئوریکی هیچ شکافی بین مقادیر ممکن وجود ندارد 0 1000 مثال‌ها داده‌هایی با معیارهای گسسته • • • • نمرات آمار تعداد دانشجویانی که دیر به کالس می‌آیند تعداد جرائمی که به مراکز پلیس گزارش شده است. تعداد دفعاتی که از یک کلمه استفاده می‌شود. عموم ًا داده‌های گسسته قابل شمارش هستند. مثال‌ها: داده‌های معیاری پیوسته • • • • سطح کلسترول قد سن زمان الزم برای انجام تکالیف مدرسه عموماً داده‌های پیوسته از اندازه‌گیری بدست می‌آیند انواع داده‌های جمع‌آوری شده در یک مطالعه تعیین‌کنندة نوع تحلیل آماری مورد استفاده می‌باشد برای مثال ... • داده‌های قیاسی عموم ًا ب ا اس تفاده از درصد (یا نسبت‌ها) خالصه می‌شوند. – 11درصد دانشجویان دارای خالکوبی می‌باشند. – 39٪،33٪ ،2٪و ٪26دانشجویان درکالس به ترتیب جدیدالورود ،سال دوم ،سال سوم و سال چهارم و برای مثال ... • داده‌های معیاری به طور مثال با استفاده از متوسط (یا میانگین) خالصه می‌شوند. – متوسط وزن مردان در بین 250دانشجوی درس آمار در پاییز ،1387 173پوند است – متوسط وزن زنان در بین 250دانشجوی درس آمار در پاییز ،1387 138پوند است آمار توصیفی توصیف داده‌ها با اعداد معیارهای مکانی چه چیزی توصیف می‌شود؟ • مکان یا مرکز داده‌ها چیست؟ (معیارهای مکانی) • داده‌ها چگونه تغییر می‌کنند؟ (معیارهای تغییرپذیری) معیارهای مکانی • میانگین • میانه • مد میانگین • • • • • نام دیگر متوسط اگر میانگین یک جمعیت را توصیف کنیم با نمایش داده می‌شود. اگر میانگین نمونه را توصیف کنیم با x-barنمایش داده می‌شود. ‏x مناسب برای توصیف داده‌های سنجشی ب ه میزان زیادی تحت‌تأثی ر مقادیر غیرمعمول که «برون‌هش ت» یا outliersنام دارند ،قرار می‌گیرد. محاسبة میانگین نمونه ‏X ‏X ni یعنی جمع تمام داده‌ها و تقسیم به تعداد آنها :فرمول میانه • نام دیگر برای صدک 50ام • مناسب برای توصیف داده‌های سنجشی • مناسب برای داده‌های برون‌هشت ،یعنی تحت‌تأثیر مقادیر غیرمعمول قرار نمی‌گیرد. محاسبة میانة نمونه مرتب کردن داده‌ها از کوچک به بزرگ اگر تعداد داده‌ها فرد باشد ،میانه مقدار وسط می‌باشد. داده‌ها1 4 3 8 2 : داده‌های مرتب شده8 4 3 2 1 : میانه محاسبة میانة نمونه مرتب کردن داده‌ها از کوچک به بزرگ اگر تعداد داده‌ها زوج باشد ،میانه متوسط دو مقدار وسطی است داده‌ها 8 1 4 3 8 2 : داده‌های مرتب شده8 8 4 3 2 1 : میانه = (= 2/)4+3 مد • مقادیری که بیشترین فراوانی را دارند. • یک مجموعه داده می‌تواند چندین مد داشته باشد • برای تمام انواع داده مناس ب اس ت ام ا بیشتر برای داده‌های قیاسی یا داده‌های گسسته با تعداد اندکی از مقادیر ممکن مفید است. Minitab:رنامةNدر ب Variable Phone Variable Phone N 139 Mean 121.6 Minimum 2.0 Median 60.0 Maximum 2000.0 TrMean 88.1 Q1 30.0 N = ‌هاN هN داد دادN عNت میانة نمونه میانگین نمونه StDev 217.7 Q3 120.0 SE Mean 18.5 مناسبترین معیارهای مکانی بستگی به شکل توزیع داده‌ها دارد :مناسبترین معیارهای مکانی بستگی دارد به • آیا داده‌ها متقارن هستند یا چوله • آیا داده‌های دارای یک مد هستند ( )unimodalیا دارای چند مد ()multimodal متقارن و یک نمایی 20 0 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0 ‏GPAs ‏Percent 10 متقارن و یک نمایی 4 3 ‏GPA 2 متقارن و یک نمایی Descriptive Statistics Variable GPA N 92 Mean 3.0698 Variable GPA Minimum 2.0200 Median 3.1200 Maximum 3.9800 TrMean 3.0766 StDev 0.4851 Q1 2.6725 SE Mean 0.0506 Q3 3.4675 متقارن و دونمایی متقارن و دونمایی Variable Males Females All N 84 89 176 Variable SE Mean Males 0.331 Females 0.305 All 0.303 Mean 70.048 64.798 67.313 Min 63.0 56.0 56.0 Median 70.000 65.000 67.000 Max 76.0 77.0 77.0 TrMean 70.092 64.753 67.291 Q1 68.0 63.0 64.0 StDev 3.030 2.877 4.017 Q3 72.0 67.0 70.0 متقارن و دونمایی چوله به راست Numb er of Musi c CDs of Sp ri ng 1998St at 250St ud ent s Frequency 20 10 0 0 100 200 300 Number o f Musi c CDs 400 چوله به راست 0 100 200 Number o f CDs 300 400 چوله به راست Descriptive Statistics Variable CDs N 92 Mean 61.04 Variable CDs Minimum 0.00 Median 46.50 Maximum 400.00 TrMean 52.93 Q1 21.50 StDev 62.90 SE Mean 6.56 Q3 83.00 چوله به چپ 30 Percent 20 10 0 50 55 60 65 70 75 80 85 90 95 100 grades چوله به چپ چوله به چپ Variable grades Variable grades N 22 Mean 89.18 Minimum 50.00 Median 93.50 Maximum 100.00 TrMean 90.60 Q1 87.00 StDev 12.92 SE Mean 2.76 Q3 98.00 انتخاب معیار مناسب مکانی • اگ ر داده‌ه ا متقارن باشن د ،میانگی ن ،میان ه و مد ،تقریباً برابر هستند. • اگر داده‌های دارای چند مد باشند ،میانگین ،میانه و یا مد را برای هر زیرگروه گزارش دهید. • اگر داده‌ها چوله باشند ،میانه را گزارش دهید. آمارهای توصیفی توصیف داده‌ها با اعداد معیارهای تغییرپذیری چه چیزی توصیف می‌شود؟ • مکان یا مرکز داده‌ها چیست؟ • داده‌ها چگونه تغییر می‌کنند؟ معیارهای تغییرپذیری • • • • دامنه دامنة بین‌چارکی واریانس و انحراف معیار ضریب تغییر تمام این معیارها تنها برای داد‌ه‌های سنجشی مناسب هستند. دامنه • تفاوت بین بزرگترین و کوچکترین داده • به میزان زیادی تحت تأثیر برون‌هشت‌ها قرار می‌گیرد. • برای داده‌های متقارن بدون هیچ برون‌هشتی مناسب است. دامنه چیست؟ GPAs of Sp ri ng 1998St at 250St ud ent s Fre q u e n cy 20 10 0 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0 GPA دامنه Descriptive Statistics Variable GPA N 92 Mean 3.0698 Variable GPA Minimum 2.0200 Median 3.1200 Maximum 3.9800 TrMean 3.0766 StDev 0.4851 Q1 2.6725 = 2.02 - 3.98 = دامنه 1.96 SE Mean 0.0506 Q3 3.4675 دامنة بین چارکی • تفاوت بین چارک سوم (درصد 75ام) و اولین چارک (درصد 25ام) یعنی نیمة وسطی داده‌ها • IQR = Q3-Q1 • برای مشاهدات برون هشت و کرانی کارا می‌باشد. • برای داده‌های چوله مناسب است. دامنة بین چارکی چیست؟ GPAs of Sp ri ng 1998St at 250St ud ent s Fre q u e n cy 20 10 0 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0 GPA دامنة بین‌چارکی Descriptive Statistics Variable GPA N 92 Mean 3.0698 Variable GPA Minimum 2.0200 Median 3.1200 Maximum 3.9800 TrMean 3.0766 StDev 0.4851 Q1 2.6725 SE Mean 0.0506 Q3 3.4675 IQR = 3.4675 - 2.6725 = 0.795 واریانس .1تفاوت بین هر داده با میانگین را بیابید. .2این تفاوت‌ها را به توان دو رسانده و با هم جمع کنید. .3به یکی کمتر از تعداد داده‌ها تقسیم کنید. 2 (x ‏ ‏x ) ‏ 2 ‏s  ‏n 1 واریانس • • • • • اگر واریانس جمعیت را اندازه بگیریم آن را با 2نشان می‌دهیم. اگ ر واریان س نمون ه را اندازه بگیریم آ ن را با s2نشان می‌دهیم. متوس ط مرب ع انحراف داده‌ه ا از میانگین خود را اندازه می‌گیرد. ب ه میزان زیادی تحت‌تأثی ر برون‌هشت‌ها می‌باشد .برای داده‌های متقارن بهتر است. واحدها درجة دوم هستند. انحراف معیار • • • • انحراف معیار نمون ه ریش ة دوم واریان س نمون ه می‌باشد و بنابراین با sنشان داده می‌شود. واحدها ،واحدهای اصلی هستند انحراف متوسط داده‌ها از میانگین خود را اندازه می‌گیرد. همچنین به میزان زیادی تحت‌تأثیر برون‌هشت‌ها قرار دارد. واریانس یا انحراف معیار چیست؟ Fa st e st Eve r Dri vi ng Spe e d 226St a t 100St ude nt s, Fa ll '98 100 Me n 126 W o me n 70 80 90 100 110 120 130 140 150 160 Spe e d (MPH) واریانس یا انحراف معیار Sex N female 126 male 100 female male Mean 91.23 06.79 Minimum 65.00 75.00 Median 90.00 110.00 Maximum 120.00 162.00 TrMean 90.83 105.62 StDev SE Mean 11.32 1.01 17.39 1.74 Q1 85.00 95.00 Q3 98.25 118.75 Females: s = 11.32 mph and s2 = 11.322 = 128.1 mph2 Males: s = 17.39 mph and s2 = 17.392 = 302.5 mph2 واریانس یا انحراف معیار چیست؟ Fast est Ever Dri vi ng Speed Se x ma le fe ma le 120 170 220 KPH 270 واریانس یا انحراف معیار Sex female male N 126 100 Mean 152.05 177.98 Sex Minimum female 108.33 male 125.00 Median 150.00 183.33 Maximum 200.00 270.00 TrMean 151.39 176.04 Q1 141.67 158.33 StDev SE Mean 18.86 1.68 28.98 2.90 Q3 163.75 197.92 Females: s = 18.86 kph and s2 = 18.862 = 355.7 kph2 Males: s = 28.98 kph and s2 = 28.982 = 839.8 kph2 ضریب تغییر • نسبت انحراف معیار نمونه به میانگین نمونه ضربدر 100 • معیار تغییرپذیری نس بی ،یعن ی تغییرپذیری نس بت ب ه بزرگی داده‌ها • بدون واحد است بنابراین برای مقایسة تفاوت بین دو گروه خوب است. ضریب تغییر Sex N Mean female 126 91.23 male 100 106.79 female male Minimum 65.00 75.00 Median 90.00 110.00 Maximum 120.00 162.00 TrMean 90.83 105.62 StDev SE Mean 11.32 1.01 17.39 1.74 Q1 85.00 95.00 Q3 98.25 118.75 Females: CV = (11.32/91.23) x 100 = 12.4 Males: CV = (17.39/106.79) x 100 = 16.3 ضریب تغییر Sex female male N 126 100 Mean 152.05 177.98 Sex Minimum female 108.33 male 125.00 Median 150.00 183.33 Maximum 200.00 270.00 TrMean 151.39 176.04 Q1 141.67 158.33 StDev SE Mean 18.86 1.68 28.98 2.90 Q3 163.75 197.92 Females: CV = (18.86/152.05) x 100 = 12.4 Males: CV = (28.98/177.98) x 100 = 16.3 مناسبترین معیار تغییرپذیری بستگی دارد به ... شکل توزیع داده‌ها انتخاب معیار مناسب تغییرپذیری • اگر داده‌ها متقارن باشند ،بدون هیچ برون‌هشت جدی ،از دامنه و انحراف معیار استفاده می‌شود. • اگر داده‌ها چوله باشند ،و یا دارای برون‌هشت باشند از دامنة بین‌چارکی استفاده می‌گردد. • اگر در حال مقایسه تفاوت در بین دو مجموعه داده باشیم ،از ضریب تغییر استفاده می‌گردد. احتمال مجموعه‌ای از قوانین احتمال حادثه • نتیجة یک مشاهده یا آزمایش یا توصیف بعضی از پیامدهای بالقوه • با این حروف نشان داده می‌شوند… ,A, B, C . احتمال • • • • • بین صفر و 1می‌باشد که نشاندهندة احتمال وقوع یک حادثه است. یک حادثه با احتمال صفر ،یک حادثة بی‌اثر است. یک حادثه با احتمال یک یک حادثة قطعی است. نزدیکتر به یک ،احتمال وقوع حادثه بیشتر است. احتمال حادثة Aرا با ) P(Aنشان می‌دهند. مثال‌ها از حادثة پوچ: • یک پرنده انسان شود • یک زن از سرطان پروستات بمیرد. مثال‌های از حادثه‌های قطعی • خورشید امشب غروب خواهد کرد. • نیمسال به پایان خواهد رسید. • یک نفر خواهد مرد. سه راه برای تعیین احتماالت • روش فراوانی • روش کالسیک • روش عقیدة شخصی توزیع نرمال و مقدمه‌ای بر توابع پیوسته چگالی احتمال ... هیستوگرام درصد IQ (Int erval s of si ze 20) 40 Pe rce n t 30 20 10 0 55 75 95 IQ 115 135 هیستوگرام مساحت مستطیل = احتمال IQ (Int erval s of si ze 20) De n si t y 0.02 0.01 0.00 55 75 95 IQ 115 135 کاهش اندازة فاصله... IQ (Int erval s of si ze 10) De n si t y 0.02 0.01 0.00 55 65 75 85 95 IQ 105 115 125 135 ... کاهش بیشتر اندازة فاصله‌ها IQ (Int erval s of si ze 5) 0.03 Densi t y 0.02 0.01 0.00 50 60 70 80 90 100 110 120 130 140 IQ توابع پیوستة چگالی احتمال ... • • • • منحنی توصیف‌کنندة احتمال هر محدوده‌ای از مقادیر را کسب می‌کند .مثل: < P(X > 120), P(X<100), P(110 < X )120 مساحت زیر منحنی = احتمال کل مساحت زیر منحنی = 1 ال احتمال بدست‌آوردن یک عدد خاص 0است .مث ً ‏P(X=120) = 0 نوع ویژه‌ای از تابع چگالی احتمال پیوسته p.d.f Bel l -shap ed curve 0.08 Mean = 70SD = 5 0.07 Densi t y 0.06 0.05 0.04 Mean = 70SD = 10 0.03 0.02 0.01 0.00 40 50 60 70 Grades 80 90 100 خصوصیات توزیع نرمال • • • • • متقارن – منحنی زنگوله‌ای شکل منحنی بستگی به میانگین جمعیت و انحراف معیار  دارد. مرکز توزیع است. وسعت منحنی بستگی به دارد. بیشت ر مقادیر اطراف میانگی ن هس تند ام ا بعض ی از مقادیر کوچکتر و بعضی بزرگتر می‌باشند. مثال‌هایی از متغیرهای تصادفی نرمال • عملکرد تولید کشاورزان در یک منطقه چقدر است؟75 باالیN احتمال Prob ab i l i t y st ud ent scores hi g her t han 75? 0.08 0.07 Densi t y 0.06 0.05 P(X > 75) 0.04 0.03 0.02 0.01 0.00 55 60 65 70 Grades 75 80 85 سطح زیر منحنی = احتمال • • • • • محاسبة جبری؟ شخصی این کار سخت را برای ما انجام داده است. ما تنها به یک جدول احتماالت برای هر توزیع نرمالی نیاز داریم. اما تعداد بینهایت توزیع نرمال وجود دارد (برای هر میانگین و انحراف معیاری یک توزیع) جواب استانداردکردن standardizeمی‌باشد. استاندارد کردن ... • مقدار xرا از میانگین کم نموده و به انحراف معیار تقسیم کنید .نتیجه مقدار zمی‌باشد .یعنی: ‏Z = (X- )/ • Zرا ن رما لاس تاندارد م ‌نی امند .م یانگی نآن  0و انحراف عیاری رابر ب ا 1دارد. ب م • سپس از جدول احتمال برای zاستفاده می‌شود. z استفاده از جدول St and ard Normal Curve 0.4 De n si t y 0.3 0.2 Tai l probabi li t y P(Z> z) 0.1 0.0 -4 -3 -2 -1 0 Z 1 2 3 4 چیست؟70 و65 احتمال بین 0.08 0.07 Densi t y 0.06 0.05 P(65< X < 70) 0.04 0.03 0.02 0.01 0.00 55 60 65 70 Grades 75 80 85 چیست؟65 زیرN احتمال 0.08 0.07 Densi t y 0.06 0.05 0.04 0.03 0.02 P(X < 65) 0.01 0.00 55 65 75 Grades 85 یادآوری! • احتماالت محاسبه‌شده دقیق هستند تنها اگر فروض ایجادشده به طور واقعی درست باشند. • وقتی محاسبات فوق را انجام می‌دهید ،فرض شما این است که داده‌ها به طور نرمال توزیع شده باشند. • همیشه این فرض را چک کنید! (بعدا ً یاد خواهیم گرفت) آزمون فرضیه مقدمه Nوصیات یک ‏Nتن خص برای دانس ‏Nر ،از یک نمونة جمعیت بزرگت تصادفی استفاده نمایید. دو راه برای یادگیری در مورد یک جمعیت • فواصل اطمینان • آزمون فرضیه فواصل اطمینان • اجازه دهید که با استفاده از داده‌های نمونه ،مقادیر جمعیت مانند میانگین یا نسبت‌های واقعی را برآورد نماییم. • مثال :متوسط واقعی زمانی که دانشجویان در آخر هفته مطالعه می‌کنند ،چقدر است؟ آزمون فرضیه • به ما اجازه دهید که با استفاده از داده‌های نمونه ،یک ادعا در ال اینکه نسبتی از جمعیت مورد یک جمعیت را آزمون نماییم .مث ً یا میانگین جمعیت برابر با یک عدد است. • مثال :آیا مقدار واقعی متوسط مطالعة دانشجویان در آخر هفته 20دقیقه است؟ ایدة عمومی آزمون فرضیه • یک فرض ابتدایی بسازید. • شواهد را جمع‌آوری کنید (داده‌ها) • بر اساس شواهد موجود ،تصمیم بگیرید که آیا فرض اولیه قابل قبول است یا خیر. اجازه دهید که این فرضیه را نشان دهیم. مثال آیا متوسط نمره 7/2است؟ چقدر احتمال دارد که 100 دانشج و دارای متوسط نمره‌ای به اندازة 9/2باشند اگر متوسط جمعیت 7/2باشد؟ جمعیت 5میلیون دانشجوی کالج نمونة 100دانشجو تصمیم‌گیری • آن محتمل یا غیرمحتمل است که ما شواهدی داشته باشیم که فرض اولیة ما را تأیید یا رد کند. • (توج ه :محتم ل یا غیرمحتم ل ب ا محاس بة احتمال مشخص می‌شود) • اگر محتمل باشد ،آنگاه ما فرض اولیة خود را رد نمی‌کنیم. یعنی شواهد کافی برای چیز دیگر نداریم. تصمیم‌گیری (ادامه) • اگر غیرمحتمل باشد ،آنگاه: – یا فرض اولیة ما درست است و ما یک حادثة غیرمعمول را تجربه می‌کنیم. – یا فرض اولیة ما نادرست است. • در آمار ،اگر غیرمحتمل باشد ،ما تصمیم به رد فرض اولیه می‌گیریم. ایدة آزمون فرضیه • اول دو فرضیه ارائه می‌کنیم ،فرضیة صفر )”• the null hypothesis (“H0 • و فرضیة جایگزین )”• and the alternative hypothesis (“HA خوا نده گ ناهکار ن یست– H0: خوا نده گ ناهکار ا ست– HA: شناسایی فرضیه‌ها • فرضی ه ص فر همیش ه نشاندهندة وضعی ت موجود می‌باش د یعنی فرضیه‌ای که نیازمند هیچ تغییری در رفتار جاری ندارد. • فرضی ه جایگزین ،نتیجه‌ای اس ت که محق ق س عی دارد آن را بدست‌ آورد. N ادامة مثال • سپس ،شواهدی مانند اثر انگشت ،لکه‌های خون ،نمونه‌های مو، الیاف فرش ،رد کف ش ،نمونه‌های دستخط و غیره جمع‌آوری می‌شود. • در آمار ،داده‌ها همان شواهد هستند. N ادامة مثال • سپس فرض اولیه ساخته می‌شود – خوانده ،بیگناه است تا وقتی که ثابت شود ،گناهکار است. • درآمار ،ما همیشه فرض می‌کنیم فرضیة صفر درست است. N ادامة مثال • سپس یک تصمیم بر اساس شواهد موجود بگیرید. – اگر شواهد کافی وجود داشت (ماورای شک منطقی) ،فرضیة صفر رد می‌شود( .خوانده گناهکار است). – اگر شواهد کافی وجود نداشته باشد ،فرضیة صفر رد نمی‌شود (خوانده گناهکار نیست) نکتة مهم • هیچ تصمیمی مستلزم اثبات فرضیة صفر یا فرضیة جایگزین نمی‌باشد. • ما فقط اظهار می‌داریم که شواهد کافی برای حرکت در یک راه یا راه دیگر نداریم. • این موضوع همیشه در آمار درست است ،موضوع این نیست که ما چه تصمیمی می‌گیریم ،همیشه شانس این وجود دارد که ما تصمیم اشتباه بگیریم. آزمون فرضیه ادامة مقدمه ... خطاهای قضاوت واقعیت گناهکار بیگناه تصمیم هیئت منصفه ‏ERROR ‏OK بیگناه ‏OK ‏ERROR گناهکار خطاها در آزمون فرضیه واقعیت فرضیة جایگزین فرضیة صفر تصمیم ‏TYPE II ‏ERROR ‏OK عدم رد فرضیة صفر ‏OK ‏TYPE I ‏ERROR رد فرضیة صفر تعاریف :انواع خطا • خطای نوع اول :فرضیة صفر رد شود درحالیکه درست است. • خطای نوع دوم :فرضیة صفر رد نشود ،وقتی اشتباه است. • همیشه شانس ایجاد یکی از این خطاها وجود دارد اما هدف ما باید حداقل کردن شانس وقوع این خطاها باشد. مثال آیا متوس ط درجة حرارت بدن 6/98درجه است؟ یا آن کمتر است؟ متوسط درجة حرارت بدن 80نفر بزرگسال 4/98درجه است. جمعیت تعداد زیادی بزرگسال نمونه 80نفر بزرگسال مثال (ادامه) • تعیین فرضیه درجه – H0:  = 98.6 درجه – HA:  < 98.6 • فرضیة اولیه را  = 98.6بسازید. • جمع‌آوری داده‌ه ا :متوس ط درج ة حرارت بدن 80نفر نمونه 4/98 ،است .احتمال این که درجة حرارت بدن یک نمون ة 80نفره از بزرگس االن کمت ر از 4/98باش د ،اگر دمای متوسط جمعیت 6/98باشد ،چه مقدار است؟ استفاده از p-value برای تصمیم‌‌گیری • • • • ‏N ‏Nیرا مNشاهده ‏Nن ‏Nة کNرا ‏NنیننNمون ‏NسNتکNه مNا چ ‏NتماNلیا ‏Nح p-valueنNشاندهندة ا ‏NتبNاشد. ‏Nس ‏Nیة صNفر در ‏Nگر فNرض ‏Nهیم کNرد ا ‏Nوا خ ‌بNاشد. ‏NینبNینصNفر و یکمNی ‏NتبNنابرا ‏Nلس ، ‏N ‏Nتما ا ‏Nح p-valueا نزدیک به صفر به معنای غیرمحتمل است. ‏Nه طور مثال کمتر از ،05/0آنگاه ‏Nد (ب ‏Nر p-valueکوچNک باش بنابراین اگ فرضیة صفر رد می‌شود. )مثال (ادامه MINITAB ندN انNیمN هایآمارN فزارN رماNن ‌ نازN واN‌ت یNیمN ه آسانN را بp-value .تآوردN دسNب Test of mu = 98.6000 vs mu < 98.6000 The assumed sigma = 0.600 Variable N Temp 80 Mean 98.4 StDev 0.67 SE Mean Z 0.0671 -2.80 .هندN یN شانم ‌دN نp اNموم ًا بN را عp-value P 0.0026 مثال (ادامه) ی هد که اگر د مایم توسط • p-valueب رابر 0026/0ن شانم ‌د یک مونة ن ب دندر جمعیت 6/98ب اشد ،غ یرمحتملاس تکه 80ن فره ب زرگسا لداراید مایم توسطب دن 4/98ب اشند. • تصمیم :رد فرضیة صفر • نتیجه اینکه دمای متوسط بدن کمتر از 6/98می‌باشد. چه نوع خطایی ممکن است برای ما پیش آید؟ • خطای نوع اول در اینجا ادعا در این مورد است که متوسط دمای بدن کمتر از 6/98است درحالیکه واقعاً اینگونه نیست. • خطای نوع دوم در اینج ا شکست در این ادعا که متوسط دمای بدن کمتر از 6/98است درحالیکه واقعاً اینگونه است. • ما فرضیة صفر را رد کردیم یعنی ادعا کردیم که دمای بدن کمتر از 6/98است بنابراین ما ممکن است خطای نوع اول را داشته باشیم. آزمون فرضیه برای میانگین یک جمعیت مثال آیا متوسط نمره 7/2است؟ چقدر احتمال دارد که 100 دانشج و دارای متوسط نمره‌ای به اندازة 9/2باشند اگر متوسط جمعیت 7/2باشد؟ جمعیت 5میلیون دانشجوی کالج نمونة 100دانشجو مقادیر p چقدر محتمل است که 100دانشجو دارای میانگین نمره‌ای به اندازة 9/2 باشند اگر متوسط جمعیت 7/2باشد؟ تعیین مقادیر P م توسطن مراتجمعیت= H0: μ = 2.7 م توسطن مراتجمعیت> HA: μ = 2.7 اگر 100دانشجو دارای متوسط نمره‌ای برابر 9/2با انحراف معیار 6/0 باشد ،مقدار Pبرابر است با: ])P(X  2.9) P[Z  (2.9 2.7)/(0.6/ 100 ‏P[Z  3.33]0.0004 تصمیم‌گیری • مقدار Pکوچک است .غیرمحتمل است که ما نمونه‌ای به اندازة 9/2داشته باشیم اگر متوسط نمرات جمعیت 7/2باشد. • فرضیة صفر رد می‌شود .شواهد کافی وجود دارد که متوسط نمرات بزرگتر از 7/2باشد. اصطالحات HA: μ > 2.7در ب رابر • H0: μ = 2.7 یک آزمون فرضی ة دنبالة راست یا یک طرفه نامیده می‌شود چون مقدار Pمربوط به دنبالة سمت راست است. • Z = 3.33 را آمارة آزمون می‌نامند. • اگر ما فکر کنیم که مقدار Pما کوچک است یعنی کوچکتر از 05/0باشد ،آنگاه احتمال اینکه ما یک خطای نوع اول بسازیم برابر 05/0اس ت .این مقدار را س طح معنی‌داری آزمون می‌نامند .ما می‌گوییم α=0.05جاییکه αسطح معنی‌داری است. مثال آیا متوس ط درجة حرارت بدن 6/98درجه است؟ یا آن کمتر است؟ متوسط درجة حرارت بدن 80نفر بزرگسال 4/98درجه است. جمعیت تعداد زیادی بزرگسال نمونه 80نفر بزرگسال pN مقادیر چقدر محتمل است که 80بزرگسال دارای یک دمای متوسط بدنی به اندازة 4/98باشد اگر متوسط جمعیت 6/98باشد؟ تعیین مقادیر P م توسط دمایب دنجمعیت= H0: μ = 98.6 م توسط دمایب دنجمعیت< HA: μ = 98.6 اگر 80نفر بزرگسال دمای بدن‌شان 4/98با انحراف معیار 6/0باشد، مقدار Pبرابر است با: ])P(X  98.4) P[Z  (98.4 98.6)/(0.6/ 80 ‏P[Z   2.98]0.001 تصمیم‌گیری • مقدار Pکوچک است ،غیرمحتمل است که ما نمونه‌ای به اندازة 4/98بدست آوریم اگر متوسط دمای بدن در جمعیت 6/98باشد. • رد فرضیة صفر .شواهد کافی برای این نتیجه که متوسط دمای بدن کوچکتر از 6/98می‌باشد وجود دارد. اصطالحات HA: μ < 98.6در ب رابر • H0: μ = 98.6 آزمون فرضیة با دنبالة چپ یا یک طرفه نامیده می‌شود ،چونکه مقدار P مربوط به سمت چپ است. آمارة آزمونم ‌بی اشد • Z = -2.98 • اگر ما فکر کنیم که مقدار Pکوچک است؛ یعنی کوچکتر از ،02/0 آنگاه احتمال اینکه ما خطای نوع اول ایجاد کنیم برابر با 02/0می‌باشد. یعنی سطح معنی‌داری برابر .α = 0.02می‌باشد. مثال آیا متوسط زمان صرف وقت برای مطالعه 20دقیقه است؟ جمعیت دانشجویان مقدار متوسط 17دقیقه با انحراف معیار 16دقیقه. نمونة 64دانشجو مقادیر P چگونه محتمل است که 64دانشجو ،به طور متوسط حداقل 17دقیقه و حداکثر 23دقیقه صرف مطالعه کنند اگر متوسط جمعیت 20دقیقه باشد؟ تعیین مقدار P رف ده = H0: μ = 20 م توسطوقتص ‌ش م توسطوقتص رفش ده HA: μ = 20# اگر 64دانشجوبه طور متوسط 17دقیقه با انحراف معیار 16دقیقه صرف مطالعه کنند ،مقدار Pبرابر است با: ])P(X 17) P[Z  (17 20)/(16/ 64 ‏P[Z   1.5]0.067 ‏P(X  23) 0.067 = P-value = 0.067 ×2بنابراین و تصمیم‌گیری • مقدار Pکوچک نیست .محتمل است که ما یک نمونه به کوچکی 17دقیقه و به بزرگی 23دقیقه داشته باشیم اگر مقدار متوسط صرف شده 20دقیقه باشد. • فرضی ة ص فر رد نمی‌شود .شواه د کاف ی برای اینکه بگوییم مقدار متوسط متفاوت از 20دقیقه است وجود ندارد. اصطالحات HA: μ # $20در ب رابر • H0: μ = 20 آزمون فرضیة دو دنباله یا دو طرفه نامیده می‌شود چونکه مقدار Pدر هر دو طرف می‌باشد. آمارة آزمونم ‌بی اشد • Z = -1.5 چون ما در رد فرضیة صفر شکست خوردیم ،ممکن است خطای نوع اول را داشته باشیم. • اگر داده‌ها به طور نرمال توزیع نشده باشند باید دارای یک ال n > 60باشیم. نمونة بزرگ مث ً نکتة بسیار مهم • مقدار Pشما ،صحیح نخواهد بود مگر اینکه فرض‌های شما درست باشد. • اگر شما نمونة کوچکی داشته باشید ،باید ببینید آیا داده‌های شما به طور نرمال توزیع شده است یا نه • اگر داده‌ها به طور نرمال توزیع نشده باشند ،شما باید یک نمونة بزرگ داشته باشید. Testing Hypotheses Made about the Means of Two Populations START Are the two samples dependent? Yes Paired t test (samples must come from normal populations): d  d t sd n No where df = n - 1 Do n1 and n2 both exceed 30? No z(x1 x2) (1  2) s12 s22  n1 n2 Yes No Are both populations normally distributed? Yes After applying the F test, what do we 12  22 conclude about ? Fail to reject Use nonparametric methods Reject 12  22 separate variances t test (samples must come from normal populations) 12  22 oled variances t test (samples must me from normal populations): where t(x1 x2) (1  2) sp 1  1 n1 n2 z test (normal distribution): and (n1  1)s12  (n2  1)s22 sp  (n1  1)  (n2  1) 2 df n1  n2  2 یادآوری • ‏Nطوح اندازه گیری در بکارگیری روشهای ‏Nه سN ‏Nه بN عدم توجN مختلNف آماری اعNم از آمار توصNیفی یا اسNتنباطی ،اشتباه رایجی است که در بسیاری از تحقیقات به چشم می‌خورد. .1س طوح اس می Nominal scaleمقوالت یک متغی ر ب ه میگیرند .زن یا مرد (همس انی یا ص ورت قراردادی کنار ه م قرار ‌ ناهمسانی) .2در سطح ترتیبی :ordinal scale جهت تغییر از کم به زیاد یا از ضعیف به شدید است ،بنابراین در این سطح عالوه بر همسانی یا ناهمسانی مقوالت ،شدت و ضعف و ترتیب آنها نیز میشود ول ی چون فواص ل بین مقوالت مشخ ص نیس ت اعداد مشخ ص ‌ نمیتوان گفت اختصاصیافته به آنها باز هم فاقد ارزش عددی است .یعنی ‌ ‌ که فالنی سه برابر دیگری به تحصیل عالقه دارد. .3سطح فاصله‌ای I‌ nterval Scale در این س طح عالوه بر تعیین س طوح مختل ف و ترتیب منطق ی و واقع ی بین مقادیر یک متغیر ،فاصلۀ بین مقادیر متغیر فوق نیز مشخص می­شود. به عنوان مثال می­توان گفت دانشجوئی که نمره 20گرفته است به اندازۀ 10 نمره با دانشجوئی که نمرۀ 10گرفته است فاصله دارد. ال اگ ر دانشجوئ ی در درس آمار در این مقیاس ص فر مطل ق وجود ندارد ،مث ً صفر گرفته باشد ،نباید فرض کرد که اصو ًال فاقد دانش آمار است .4سطح نسبی Ratio Scale باالترین و دقیق ترین س طح اندازه‌گیری اس ت که عالوه بر تعیین س طوح و مقادیر یک متغیر و تعیین فاص له بین مقادیر یک متغیر ،نس بت‌ها نیز قاب ل محاس به و بیان هس تند و مبنای اندازه‌گیری نیز ص فر مطل ق اس ت .مانن د میزان درآم د یا حس اب دانشجو -در این متغیر اگر حساب دانشجو صفر باشد واقع ًا هیچ پولی در حساب او نیست زیرا این متغیر دارای صفر مطلق است و وجود ص فر حقیق ی ب ه عنوان مبدأ اندازه‌گیری محق ق را قادر میسازد تا از روشهای مختلف آماری استفاده کند. ‌ یادآوری اسمی ترتیبی فاصله‌ای یا نسبتی شاخصهای مرکزی ‌ مد مد ،میانه مد ،میانه ،میانگین شاخص‌های پراکندگی فراوانی نسبی طبقات چارک‌بندی واریانس انحراف‌معیار دامنه تغییرات قرینه‌(سطح توزیع) متقارن چولگی تحلیل روابط بین متغیرها میتواند تصویری از جامعه مورد مطالعه ارائه دهد .اما • آمار توصیفی تنها ‌ قادر به بیان رواب ط بین متغیرها و تبیین متغیر یا متغیرهای وابسته نیست زیرا در این سطح محقق در هر مرحله تنها با یک متغیر سروکار دارد • محق ق در تحقیقات مختل ف عمدت ًا بدنبال تحلیل و تبیین داده‌ه ا و میکن د ب ا اس تفاده از آمار متغیرهای موردنظ ر اس ت ب ه همین دلیل س عی ‌ اس تنباطی ب ه بررس ی رواب ط بین متغیره ا ،تفاوت موجود در بین گروه‌های مورد مطالع ه و یا تبیین متغیر وابس ته از طریق متغیرهای مس تقل و غیره بپردازد. روابط بین متغیرها • آیا ارتباط ی بی ن دو یا چن د متغی ر وجود دارد؟ اگ ر جواب مثبت است ،این ارتباط در چه سطحی است؟ • آیا می‌توان تغییرات یک متغی ر را از طریق متغی ر یا متغیرهای دیگر پیش‌بینی و تبیین کرد؟ پاسخ سؤال اول از طریق تکنیک همبستگی و سؤال دوم از طریق امکانپذیر است. ‌ روش تحلیل رگرسیون میتوان از طریق )1جداول در رابطه با تحلیل دومتغیره روابط بین متغیرها را ‌ توافق ی )2ضریب همبس تگی اس پیرمن )3ضریب همبس تگی پیرس ون و برای پیشگویی تغییرات یک متغیر از طریق متغیر دیگ ر از رگرس یون ساده بهره جست. در رابط ه ب ا جمعیت چن د متغیره ،رواب ط بین متغیره ا از طریق )1ضریب همبس تگی چندگان ه و )2ضریب همبس تگی جزئ ی و پیشگوئ ی تغییرات یک متغیر از طریق متغیرهای دیگ ر ب ا اس تفاده از رگرس یون چندگان ه امکانپذیر است. ‌ در حاشیه: تفاوت عمدۀ همبستگی و رگرسیون تفاوت رگرس یون ب ا ضریب همبس تگی در این اس ت که رگرس یون بدنبال پیشبینی است در حالیکه ضریب همبستگی تنها میزان وابستگی دو متغیر ‌ میکند. را با هم بررسی ‌ در رگرس یون فرض بر این اس ت که متغیر وابس ته تص ادفی و متغیرهای نمونهگیری تکراری) ‌ توضیح ی دارای مقدار ثاب ت یا غیرتص ادفی (در میباشند .در همبس تگی فرض بر این اس ت که ه ر دو متغیر تص ادفی ‌ هستند. -ضریب همبستگی قادر به بیان روابط علی و معلولی بین متغیرها نیست. جدول توافقی هدف از تشکیل یک جدول توافقی نشان دادن هر نوع رابطه‌ای اس ت که ممکن اس ت بی ن دو متغی ر متغیرهای کیفی، ‌ وجود داشته باشد‌ .در مثال حاضر جنس (با سطوح مرد و زن) و رد کردن (با سطوح بله و خیر) می‌باشد. از روی جدول روش ن می‌شود که در حقیق ت رابطه‌ای بین این دو متغیر وجود دارد .به طوری که واضح ًا نس بت بیشتری از پاس خ‌دهندگان زن ،برنام ه مورد نظر را رد می‌کنند رد کردن بله خیر زن 30 20 مرد 10 40 ضرایب همبستگی مرتبط با متغیرهای اسمی ‏2 آزمونهای ناپارامتری است. ‌ .1کای‌اسکوئر :یکی از این آزمون توسط فیشر ارائه شد و قادر است تا به سنجش آماری معنیداری تفاوت بین فراوانیهای مشاهده شده و فراوانی‌های ‌ مورد انتظار بدست‌آمده از جامعه بپردازد. این آزمون نشان می‌دهد که آیا تفاوت موجود بین مقادیر فوق از نظرآماری معنی‌دار اس ت یا این تفاوت عمدت ًا براس اس شان س است. شرایط استفاده از آزمون کای‌اسکوئر .1 .2 .3 .4 • • دادههای مشاهده‌شده باید به صورت تصادفی گردآوری شده باشند. ‌ کلیه موارد موجود در نمونه باید مستقل از هم باشند. حتیاالمکان هیچ یک از خانه‌های جدول نباید کمتر از 10باشند (البته ‌ برخی آماردانان تعداد 5مورد را ذکر می­کنند) تعداد نمونه باید به اندازۀ کافی بزرگ باشد .بهتر است حجم نمونه در اینگونه تجزیه و تحلیلها حداقل 50مورد باشد. میتواند برای یک متغیر اسمی و یک متغیر ترتیبی کایاسکوئر ‌ آماره ‌ نیز بکار رود. ال عکس العمل چهار نوع کود یا چهار سطح از یک ماده شیمیائی در (مث ً دو سطح خاک) Nیب همبستگی چوپروف ()T .2ضر • به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه بکار گرفت ه می‌شود و مقدار آ ن همواره بین ص فر و یک در نوس ان است .این آزمون زمانیکه هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیب ی باش د مورد اس تفاده قرار می‌گیرد .ام ا نباید تعداد سطر و ستون با هم برابر باشند به عبارت دیگر این ضریب برای جداول توافقی مستطیلی بکار گرفته می‌شود. .3ضریب همبستگی فی phi • ب ه منظور بررس ی شدت همبس تگی بین دو متغیر اس می که ب ه ص ورت میباشد مورد استفاده قرار می‌گیرد به دووجهی و در قالب جدول توافقی ‌ کایاسکوئر ،از ضریب همین دلیل در اینگونه موارد باید بجای استفاده از ‌ همبستگی فی استفاده نمود. کایاسکوئر کایاسکوئر در این است که ‌ • تفاوت ضریب همبستگی فی با ‌ معنیداری همبس تگی بین متغیره ا را تعیین می‌کن د در حالیکه س طح ‌ میدهند .این ضریب کایاس کوئر را نشان ‌ ضریب ف ی شدت همبس تگی ‌ کایاسکوئر تفسیر می‌گردد و مقدار آن همواره بین صفر و یک همانند ‌ است. .4ضریب همبستگی توافق پیرسون ‏Pearson s coefficient contingency این ضریب که آنرا با Cنمایش می‌دهند میزان همبستگی بین دو متغیر اس می را که ب ه ص ورت توافق ی تنظیم شده‌ان د محاس به خانههای جدول میکند .این شاخ ص زمان ی بکار می‌رود که ‌ ‌ توافقی بیش از باشد. .5ضریب کرامر: • این ضریب برای تعیین میزان شدت همبس تگی بین دو متغیر اس می مورد اس تفاده قرار می‌گیرد و آنرا ب ا نشان می‌دهن د که مقدار آ ن همواره بین ص فر و یک در نوس ان اس ت این ضریب در مقایسه با سایر ضرایب انعطاف بیشتری دارد به طوریکه هم برای جداول توافق ی بیشت ر از و ه م برای جداول مس تطیلی بکار میرود. ‌ ضرائب همبستگی مرتبط با متغیرهای ترتیبی رتبهای کندال .1ضریب همبستگی ‌ ‏kendall s rank correlation ‏coefficient شاخص کندال حالت تقارن دارد به این معنا که متغیرها قرینه بوده و برای محقق مهم نیست که کدامیک از متغیرهای مورد مطالعه وابسته و کدامیک مستقل می‌باشد .این شاخص مشخص می‌کند که تا چ ه میزان افزایش یا کاهش در یک متغیر با افزایش یا کاهش در متغیر دیگر همراه است .مقدار ضریب کندال همواره بین -1تا +1در نوسان است. .2ضریب گاما Gamma coefficient • شاخIص اسIت کIه از طریIق آIن می‌توان بIا آگاهIی از پاسIخهای یک متغیIر پاسIخ‌ها و نتایIج متغیIر دیگIر را پیشگوئIی کرد .گامIا در واقع میزان کاهIش خIط را کIه در نتیجIه آگاهIی از پاسIخ افراد در متغیر مستقل رخ می‌دهد مشخص می‌کند. .3ضریب همبستگی رتبه‌ای اسپیرمن ‏Spearman Rank Correlation Coefficient • ایIن ضریIب زمانIی مورد اسIتفاده قرار می‌گیرد کIه داده‌هIا بIه صIورت رتبه‌ای متوالی ناپیوسIته ( ...و 3و 2و )1باشIد و یIا ایIن کIه مقادیIر اصIلی بIه رتبIه تبدیل شوند .در صIورتیکه داده‌هIا بIا مقیاس فاصIله‌ای یIا نسIبتی اندازه‌گیری شده باشنIد می‌توان آنهIا را به رتبه تبدیل کرد و بعد ضریب همبستگی رتبه‌ای اسپیرمن را محاسبه نمود. • ضریIب همبسIتگی اسIپیرمن کIه آنرا بIا rsنمایIش می‌دهنIد همواره بین +1و -1در نوسان است و از لحاظ سطح سنجش نیز ترتیبIی و از نوع متقارن می‌باشد به همیIن دلیل برای محقق مهم نیست که کدام متغیر مستقل و کدامیک وابسته باشد. ضریب همبستگی مرتبط با متغیرهای فاصله‌ای یا نسبی ضریب همبستگی پیرسون ‏Pearson Correlation Coefficient • از روشهای پرکاربرد جهIت تعییIن میزان رابطIه بیIن دو متغیر مصIوب گردیده و بIا عالمIت rنشان داده می‌شود .ایIن ضریIب به منظور بررسIی رابطIه بیIن دو متغیIر فاصIله‌ای یIا نسIبی مورد استفاده قرار می‌گیرد و مقدار آن بین +1و -1در نوسان است. • اگر این ضریب مثبت باشد به معنای آن است که تغییرات در برد و متغیر به طور هم جهت اتفاق می‌افتد و بالعکس. اسمی دوحالتی دوحالتی چندحالتی ضر یب فی الندا ضریب چوپروف ‏Nمر الNندا VکNرا اسمی چندحالتی ترتیبی فاصله‌ای یا نسبی ضریب چوپروف ضریب کرامر ضریب توافقی پیرسون کرامر ضریب فی یا کرامر ترتیبی فاصله‌ای یا نسبی تتا Vکرامر -ضریب فی الندا کندال تائو ( bبرای جداولتوافقی مربع) کندال تائو (cبرای جداولتوافقی مستطیلی) ضریب همبستگی رتبه ایاسپیرمن -گاما مقادیر فاصله ای به رتبه ای تبدیل و ضریب همبستگی رتبه ای اسپیرمن با کندال تائو محاسبه می شود مقادیر فاصله ای به رتبه ای تبدیل و ضریب همبستگی رتبه ای اسپیرمن با کندال تائو محاسبه می شود ضریب همبستگی پیرسون :نکته • • • • دو نکته در رابطه با ضریب همبستگی وجود دارد که توجه به آنها بسیار ضروری است. الIف -وجود همبسIتگی بیIن دو متغیIر بIه معنای ایIن نیسIت کIه آنهIا دارای اثرات مساوی هسIتند و یIا یکIی علIت دیگری اسIت ،زیرا ممکIن اسIت هIر دو تحIت تأثیIر عامل دیگری باشند. بIه عنوان مثال اگIر بیIن میزان غیبIت از کار و رضایIت شغلIی رابطIه متغیIر وجود داشته باشد نمی­توان نتیجه گرفت که دلیIل زیاد بودن غیبت عدم رضایت شغلی است زیرا ممکن اسIت کIه غایIب بودن خود باعIث احسIاس عدم رضایIت شغلIی باشIد و یIا هIر دو تحت تأثیر عامل دیگر قرار گرفته باشد. ب -همبستگی ساده نشان می‌دهد که بین دو متغیر چقدر ارتباط خطی وجود دارد. انتخاب آزمون مناسب برای مقایسۀ میانگین‌ها • چنانچIه داده‌های مربوط بIه متغیIر وابسIته از نوع کمIی با مقیاس (فاصIله‌ای یIا نسIبی) و داده‌های متغیIر مسIتقل یا گروه‌بندی از نوع کیفIی بIا مقیاس (اسIمی یIا ترتیبIی) باشIد برای بررسIی تفاوت ها می‌توان بIه مقایسIه میانگین‌هIا پرداخت و معنی‌داربودن تفاوت‌های موجود بین طبقات یا گروه‌ها را مورد بررسی قرار داد. آزمونهای پارامتری • آزمونهای tو Fعمده‌ترین آزمونهای آماری برای مقایسۀ میانگین گروه‌ها می‌باشند .از آنجا که گروه‌های مورد بررسی ممکن اس ت مس تقل ب ا همبس ته باشن د بنابراین ه ر یک از آزمونهای فوق به دو بخش مستقل و همبسته تقسیم می‌شوند. تصمیم‌گیری در مورد این‌که در چه مواقعی باید از آزمونهای t یا Fمستقل یا همبسته استفاده کرد مهمترین مسأله در تحلیل داده های کمی است. آیا گروه‌های مورد بررسی مستقل هستند یا همبسته؟ مستقل‌اند سه گروه یا بیشتر آزمون Fمستقل آزمون tمستقل همبسته‌اند دو گروه سه گروه یا بیشتر آزمون Fهمبسته آزمون tهمبسته دو گروه شفIرضهای آزمونهای پارامتری پی ‌ • • • • • آزمونهای پارامتری tو Fرا با پیش فرضهای زیر میتوان مورد استفاده قرار داد: مشاهدات از یک جامعه نرمال انتخاب شده باشند. اطالعاتIی کIه بIا هIم مقایسIه می‌شونIد بایIد تقریب ًا واریانIس یکسIانی داشتIه باشند (در نمونه‌های بزرگ اگIر واریانIس یIک گروه دو برابر دیگری باشIد باز هم می‌توان از آزمونهای پارامتری استفاده نمود) داده‌های گردآوری شده دارای مقیاس فاصله‌ای یا نسبتی باشند. اگIر اطالعات جمع‌آوری‌شده ایIن سIه شرط را نداشIت می‌توان داده‌های فوق را بIه غیر پارامتری تبدیIل کرد و از روش‌های آماری غیرپارامتری استفاده نمود .روش عمده تبدیل داده­های پارامتری به غیرپارامتری ،رتبه‌بندی کردن آنها می‌باشد. الIف -آزمون :tاگIر متغیرمسIتقل یIا متغیرگروه‌بندی تنهIا دو گروه داشته باشد. (اگر بخواهیم درآمد زنان و مردان را با هم مقایسه کنیم) ب -آزمون ( Fتحلیل واریانس )ANOVA • اگر تعداد گروهها بیش از دو باشد. (اگر بخواهیم میزان درآمد گروههای شغلی کارگر ،کارمند و کشاورز را با هم مقایسه کنیم) • نکته :آزمون Fتنها معنی‌داری تفاوت بین میانگین گروه‌ها را مورد بررسی قرار می‌دهد امIا مشخIص نمی‌کنIد کIه ایIن تفاوت‌هIا در بیIن کدامیIک از گروه‌های مورد بررسی وجود دارد .بIه همیIن دلیIل برای ایIک کIه بدانیIم تفاوت‌های بدسIت‌آمده در بیIن کدامیک از طبقات وجود دارد و از ایIن طریIق مقایسه‌ای بیIن گروه‌هIا انجام گیرد ،بایIد از آزمون شفه ( )Scheffe testیIا LSDو یIا از آماره‌هایIی نظیIر توکی TukeyیIا دانکن DuncanاسIتفاده کرد .ایIن آزمونهIا میانگیIن زوج‌هIا را بIا همدیگIر بIه صورت دوبدو مقایسه کرده و وجود اختالف معنی‌دار بین آنها را نشان می‌دهد. این روش کل واریانس موجود در یک مجموعه از داده‌ها را به دو بخش تقسیم می‌کند. • • • بخشی از این واریانس ممکن است بخاطر شانس و تصادف حادث شده باشد و بخش دیگر ممکن است ناشی از دالیل یا عوامل خاصی باشد ،از طرف دیگر واریانس موجود ممکن است ناشی از تفاوت بین گروههای مورد مطالعه و یا بخاطر تفاوت موجود در درون نمونه‌ها حادث شده باشد. مهمترین اصل در تحلیل واریانس ( )ANOVAآزمایش تفاوت‌های موجود در بین میانگین‌های جوامع یا گروههای مورد مطالعه از طریق بررسی میزان واریانس بین گروه‌ها نسبت به واریانس درون گروه‌هاست. در واریانس درون جامعه فرض بر این است که تفاوت بین مقدار نسبت به میانگین جامعه بخاطر شانس است در حالیکه در بررسی تفاوتهای بین جوامع و گروهها ،فرض بر این است که تفاوت بین میانگین جامعه یا نمونۀ jام با میانگین کل به دلیل عوامل خاص می‌باشد .بنابراین زمانی که از تحلیل واریانس استفاده می‌شود فرض می‌گردد که هر یک از نمونه‌ها از یک جامعه نرمال انتخاب شده‌اند و هر یک از این جوامع نیز واریانس برابری دارند همچنین فرض می‌شود کلیه عوامل بجز عواملی که مورد مطالعه می‌باشند تحت کنترل هستند. :نکته • در تحلیIل واریانIس ،اگIر در بیIن میانگیIن گروههای مختلف تفاوت معنی‌داری وجود داشته باشد تنها از طریق ANOVAنمی‌توان محل این تفاوت‌ها را بدست آورد. • اگIر بIه مقایسIۀ سIه گروه A، B، CبپردازیIم و تفاوت معنی‌داری در بیIن آنها وجود تهIا بیIن Aو BاسIت یIا بین Bو داشتIه باشIد نمی‌توانیIم قضاوت کنیIم کIه آیIا ایIن تفاو ‌ Cیا بین Aو .C • در چنیIن مواقعIی نبایIد از طریIق آزمون tبIه مقایسIه دوبدو گروههIا پرداخIت ،زیرا هر قدر تعداد دفعاتی که آزمون tانجام می‌گیرد بیشتر باشد سطح اطمینان نتایج پائین می‌آید. • (در این موارد باید از آزمونهائIی مانند آزمون شفه ،آزمون چنددامنه دانکن ،آزمون توکی و آزمون استیودنت نیومن ،کیول برحسب ضرورت استفاده کرد. تحلیل واریانس یکطرفه: ‏One-way Analysis of Variance اگر محقق تنها یک متغیر (درآمد) را انتخاب کند و بخواهد تفاوت بین طبقات یا گروههای مختلف را بررسی کند در این صورت از تحلیل واریانس یکطرفه استفاده می‌کند. تحلیل واریانس دوطرفه: ‏Two way Analysis of Variance ‏Nته بررسی ‏Nل را بر روی یک متغیر وابس ‏Nر دو عام ‏Nد اث ‏Nق بخواه ‏Nر محق اگ کند باید از تحلیل واریانس دوطرفه استفاده کند. آزمونهای غیرپارامتری ال نیOز بحOث گردید آزمونهای پارامتری عالوه بر • همانطوری کOه قب ً ایOن کOه نیاز بOه داده‌هائOی از نوع فاصOله‌ای دارنOد بایOد از برخی از پیOش فرض‌های اولیOه نیOز برخوردار باشنOد (نرمال بودن توزیع در جامعOه و داشتOن واریانOس یکسOان در مواردی کOه دو یOا چنOد جامعه با هم مورد مقایسه قرار می‌گیرند و )... • امOا در آزمونهای غیرپارامتری چنیOن پیش‌فرضهائی مطرح نبوده و زمانOی کOه داده‌هOا در سOطح اسOمی و یOا ترتیبOی باشOد و یا در صOورتیکه گروه‌های مورد مطالعOه از واریانOس Oنابرابر و یا از چولگOی برخوردار باشنOد بایOد از آزمون‌های غیرپارامتری استفاده کرد .ایOن آزمو ‌نهOا از ویژگی‌هائOی برخوردار هسOتند کOه آنها را از آزمون‌های پارامتری متمایز کرده است: .1ایOن آزمونهOا هیچکدام از پیش‌فرضهای مطرح شده در آزمونهای پارامتری ،نظیر نرمال بودن جامعOه و یOا برابر بودن واریانOس گروههOا را مبنOا قرار نمی‌دهOد و حتی در صورت صادق نبودن مفروضات فوق در خصوص داده‌های فاصله‌ای به منظور استفاده از آزمونهای پارامتری امکان تبدیل داده های فوق به داده‌های غیرپارامتری و رتبه‌ای و محاسبه آزمونهای ناپارامتری وجود دارد. .2از آنجOا کOه در ایOن آزمونهOا از مقادیOر رتبه‌ای و حتOی داده‌های اسOمی استفاده می‌گردد، بنابراین محاسبۀ آنها کار ساده‌ای است. .3ایOن آزمونهOا در مقایسOه بOا آزمونهای پارامتری از دقOت باالئی برخوردار نمی‌باشند. دلیOل آOن ایOن اسOت کOه بOا تبدیOل داده‌های فاصOله‌ای بOه مقادیOر رتبه‌ای ،فواصOل واقعی موجود در بیOن داده‌هOا به فواصOل یکسOان بیOن رتبه‌ها تبدیل شده و در این فرآینOد بخشی از اطالعات ناپدید می‌گردند به عبارت دیگر با تبدیل مقادیر اصلی و واقعی به مقادیر رتبه‌ای ،بدلOی از واقعیOت سOاخته می‌شود و ایOن بدل بدسOت‌آمده بOه جای واقعیت مورد تجزیه و تحلیل قرار می‌گیرد. انتخاب آزمون غیرپارامتری مناسب 1. N ‏Nه ‏NموننNشان :آز زمانی که داده‌ها به صورت همبسته باشند مورد استفاده قرار می‌گیرد. :آزمون مک نمار • اغلNب در مواردی بکار برده می‌شود کNه داده‌هNا به ‏Nط بهم (Two ‏Nه مرتب ‏Nه دو نمون ‏Nمی و مربوط ب ‏Nورت اس ص )relatedیا همبسته باشند (زمانی که بخواهیم نظرات قبلی و بعدی افراد را مورد مقایسه قرار دهیم) • مثال .1ابتدا در مورد یک موضوع نظر افراد را به صورت موافق یا مخالف جویا می‌شویم پس از آن نسبت به برگزاری کالس آموزشی اقدام می‌کنیم (یاجلسۀ توجیهی) و سپس دوباره نظر افراد را نسبت به موضوع جویا می‌شویم .در اینجا فرض صفر ( )Hoاین است که تفاوتی بین نظرات افراد در قبل و پس از اجرای برنامه (دورۀ آموزشی) وجود ندارد. • مثال .2نظرات 1000نفر درباره خرید و عدم خرید یک کاال قبل و بعد از برگزاری برنامه تبلیغاتی و معرفی کاال پرسیده شده است با این آزمون می‌توان مشخص نمود که آیا برنامه تبلیغاتی در تغییر نگرش مشتریان مؤثر بوده است یا خیر. .3آزمون ویلکاکسون ‏Wilcoxon Test • در بسOیاری از پژوهشهائOی کOه نمونه‌هOا بOه صOورت جفت شده و همبسOته هسOتند ممکOن اسOت محقOق بخواهOد هOم جهOت تغییOر و هم میزان تغییOر را مورد بررسOی قرار دهOد ،برای این منظور آزمون ویلکاکسون تست مناسبی است. • داده های مورد اسOتفاده در ایOن آزمون حداقOل بایOد در سطح ترتیبی باشند. • مثال :نظOر تعدادی از مشتریان در رابطOه بOا دو نوع کاالی مشابه اما با مارک‌های متفاوت از نظر کیفیت محصول سؤال شده است. .4آزمون فریدمن Fridman Test • آزمون فریدمن یکOی از آزمونهای غیرپارامتری اسOت ایOن آزمون در واقع معادل آزمون Fدر روشهای پارامتری می‌باشOد امOا در اینجOا برخالف آزمون ،Fفرض توزیع نرمال و برابر بودن واریانس ضرورتی ندارد. • این روش برای مقایسه سه گروه یا بیشتر از سه گروه همبسته بکار می‌رود. • مثال :نظرات 30نفOر از فراگیران را درخصOوص سOه روش مختلOف تدریOس جویOا شده‌Oایم و پاسخ‌ها نیز از ( 1بسیار نامناسب) تا ( 5بسیار مناسب) امتیازبندی شده‌اند. Nان .5آزمون کوکر • • • • • یکIی از روشهای ناپارامتری و درواقع تعمیم‌یافتIه آزمون مIک نمار است بIا این تفاوت که این روش برای مواردی که تعداد گروهها یا تکرار سه یا بیشتر از سه باشد بکار می‌رود: داده‌های ایIن آزمون بIه صIورت اسIمی می‌باشIد و وجود تفاوت بین نظرات افراد را مورد بررسی قرار می‌دهد. مثال :نظرات افراد نسبت به یک موضوع در زمانهای مختلف پرسیده می‌شود قبل از برگزاری یک دورۀ آموزشی (موافقت – مخالفت)(موافقت – مخالفت) بعد از برگزاری دوره -بعد از اجرای عملی محتویات دوره (موافقت – مخالفت) .6آزمون من -ویتنی ‏Mann – Whitney Test • برای مقایسIه میانگین‌های دو جامعIه مسIتقل زمانIی کIه داد ‌ههIا به صورت رتبه‌ای یا ترتیبی باشند مورد استفاده قرار می‌گیرد. • مثال :فرض کنیIد دو گروه 30نفره از فراگیران با دو روIش متفاوت آموزش Iدیده و نتیجIه ارزیابIی آنها از دوره‌های فوق در قالب امتیازات 1تا 5گردآوری شده است. .7آزمون کولموگروف -اسمیرنف ‏Kolmogrov – Smirnov Test • چنانچIه در بحIث کای‌اسIکوئر گفتIه شIد اگر فراوانی‌های مورد انتظار IبیIش از 20درصIد خانه‌های جدول ،کمتIر از 5باشد ،در ایIن صIورت نمی‌توان از فرمول کای‌اسIکوئر اسIتفاده کرد ،این ال زمانی پیش می‌آید که حجم نمونه کمتر از 50باشد مشکل معمو ً و یIا تعداد خانه‌های جدول بیشتIر باشد .در چنیIن حالتی می‌توان از تسIت کولموگرف -اسIمیرنف اسIتفاده کرد .اسIاس این آزمون مقایسIه فراوانIی تجمعIی نسIبی مشاهده شده بIا فراوانIی تجمعی نسبی مورد انتظار می‌باشد. - Nوالیس .8آزمون کروسکال ‏Kruskal – Wallis Test • • • • ایOن آزمون در واقOع معادل تحلیOل واریانOس یکطرفOه می‌باشOد ،امOا برخالف آOن نیازی به مفروضات آOن نظیOر اینکOه نمون ‌ههOا از یOک جامعOۀ نرمال بدسOت‌آمده باشنOد و یOا اینکه انحراف معیار یکسOانی داشتOه باشنOد وجود ندارد .آزمون کروسOکال والیOس زمانی استفاده می‌‌شود که تعداد نمونه‌ها بیش از دو گروه باشد. مثال :از 90نفOر دانشجOو در سOه رشتOه مختلOف درخواسOت شOد تOا کیفیت برنامه‌های آموزشOی دانشکده را ارزیابOی کنند .امتیازات ارائOه شده توسOط افراد فوق از ( 1بسیار ضعیف) تا ( 5بسیار قوی) در نوسان بوده است. ‌داریوOجود نOدارد. :HoبOOیننOOظراOتداOنOشجویانرشOته‌هایمOختلفتOOفاوOتمOعنی ایOن آزمون اگرچOه وجود تفاوت بیOن نظرات گروه‌های مختلOف را نشان می‌دهOد اما مشخص نمی‌کند که این تفاوت در بین کدام یک از گروه‌ها وجود دارد. آزمون میانه: ‏Median test • یکی دیگر از روشهای غیرپارامتری است که برای مقایسه سه یا بیشتر از سه گروه مورد اسIتفاده قرار می‌گیرد .اطالعات مورد نیاز در ایIن روش بایIد در سطح رتبه‌ای بوده و حتی‌االمکان داده‌هIا هم‌رتبIه نباشنIد ،زیرا اگIر میانIه مشترک بیIن گروهها جزو نمرات تکراری باشد در این صورت تشخیص تفاوت گروهها با مشکل مواجه می­گردد. • مثال :می‌خواهیIم بدانیIم آیIا سIرعت عمIل کارگران سIه شیفIت مختلIف یIک کارگاه خیاطی با هم متفاوت است یا خیر؟ • برای ایIن کار تعداد شلوار دوختIه شده توسIط 40کارگIر (از سIه شیفIت مختلIف) در یک هفته گردآوری شده است. طبقه‌بندی روش‌های تحلیل چندمتغیره • انتخاب روش مناسب برای تجزیه و تحلیل داده‌ها مهمترین قدم در تحلیل داده‌های گردآوری شده محسوب می‌گردد. • متأس فانه ب ه دلی ل عدم آشنائ ی ب ا منط ق حاکم بر روش‌های مختل ف آماری چن د متغیره ،ب ه اشتباه یکی ب ه جای دیگری مورد استفاده قرار می‌گیرد و تکنیک‌های مختلف به طور نابجا بکار گرفته می‌شوند. روشهای چن د متغیره در تجزیه و ‌ ب ه منظور آشنائ ی ب ا نحوه بکارگیری دادهها ،درخت تصمیم‌گیری برای استفادۀ اصولی و متناسب با تحلیل ‌ دادهها و هدف تجزیه و تحلیل ارائه شده است، نوع ‌ این طبقه‌بندی بر مبنای سؤاالت و مفروضات خاصی انجام گرفته است: دادههای مورد نظ ر قاب ل تقس یم ب ه متغیرهای مس تقل و متغیرهای .1آیا ‌ وابسته هستند؟ .2اگ ر چنی ن تقس یم‌بندی امکان‌پذیر اس ت ،چن د متغی ر از موارد فوق، میباشند؟ متغیر وابسته ‌ اندازهگیری ‌ .3متغیرهای موجود در تجزیه و تحلی ل در چ ه س طحی شدهاند؟ ‌ تصمیمگیری برای انتخاب ‌ پاسخ این سه سؤال محقق را در مناسبترین تکنیک تجزیه و تحلیل چند متغیره کمک می‌کند. ‌ میکن د که آیا باید از تکنیکهای وابس تگی • پاس خ س ؤال اول مشخ ص ‌ ( )Dependenc Techniqueاستفاده نمود یا باید از تکنیکهای هم ‌وابستگی ( )Interodependence Techniqueبهره گرفت. تکنیکهائ ی هس تند که در آ ن یک یا چن د متغی ر ب ه عنوان ‌ • روشهای وابس تگی متغیرهای وابس ته لحاظ شده و تغییرات آ ن براس اس متغیرهای مس تقل دیگ ر مورد میگیرد مانند روش رگرسیون چندگانه یا تحلیل واریانس چند بررسی و تبیین قرار ‌ متغیره و غیره. • تکنیکهائ ی هس تند که در آ ن متغیرهای مس تقل و وابس ته ‌ روشهای ه م وابس تگی ‌ وجود ندارد ،بلکه در این روش‌ه ا مجموع ه متغیره ا ب ه طور همزمان و ب ا ه م مورد میگیرند .مانند روش تحلیل عاملی. تجزیه و تحلیل قرار ‌ • • • • • • اگ ر موضوع مورد تجزیه و تحلی ل دارای یک متغی ر وابس ته از نوع پارامتری باش د ،روش مناسب برای تجزیه و تحلیل آن تحلیل رگرسیون چندگانه است. دادههای فوق دارای یک متغی ر وابس ته باش د ام ا متغی ر فوق از نوع غیرپارامتری * چنانچ ه ‌ دووجهی باشد ،روش مناسب رگرسیون لوجیستیک و تحلیل تشخیص چندگانه است. چنانچه متغیر وابسته غیرپارامتری چندوجهی باشد باید از تحلیل تشخیصی استفاده شود در تحلی ل تشخیص ی متغی ر وابس ته از نوع غیرپارامتری و متغیرهای مس تقل از نوع پارامتری هستند. اما چنانچه متغیرهای وابسته و مستقل هر دو غیرپارامتری باشند روش مناسب برای تجزیه و میباشد. دادهها رگرسیون لوجیستیک ‌ تحلیل ‌ دادههای پارامتری و هم غیرپارامتری سازگار است. تحلیل مسیر روشی است که هم برای ‌ اگر متغیرهای مربوط به موضوع مورد بررسی دارای چند متغیر وابسته باشد در این صورت دو تکنیک دیگر برای تجزیه و تحلیل مناسب خواهند بود. – اگر متغیرهای وابس ته پارامتری باشند تحلی ل واریانس چند متغیره یا تحلیل همبستگی کانونی مناسب خواهد بود میتوان از طریق تبدیل آنها به – اما اگر متغیرهای وابسته مورد نظر غیرپارامتری باشد ‌ متغیرهای مجازی کدبندی شده به صورت ( )0 ،1از روش تحلیل کانونی استفاده کرد. روشهای هم‌وابس تگی بر مبنای وجود یا عدم وجود متغیرهای وابسته مورد تجزیه و تحلیل قرار نمی‌گیرند زیرا در این روشها کلیۀ متغیرها به طور همزمان و با همدیگر بررسی می‌شوند این روشها از نظر پارامتری یا غیرپارامتری بودن داده‌ها به دو گروه جداگانه تقسیم می‌شوند. خوشهای ‌ – پارامتری :تکنیکهای تحلیل عاملی و تحلیل – غیرپارامتری :داده‌های غیرپارامتری از طریق کدبندی متغیر مجازی (به صورت صفر و یک) قابل بکارگیری در روشهای تحلیل عاملی و خوشهای هستند. ‌ تحلیل • از س وی دیگ ر ه م داده‌های پارامتری و ه م غیرپارامتری قاب ل استفاده در تکنیک مقیاس‌بندی چندبعدی می‌باشند. رگرسیون جمع‌آوری داده‌ها • سه روش اصلی برای جمع‌آوری داده‌ها: – مطالعات قبلی بر اساس داده‌های تاریخی – مطالعة مشاهده‌ای – طرح آزمایشی (بهترین حالت) کاربرد رگرسیون • • • • توصیف داده‌ها برآورد پارامترها پیش‌بینی و تخمین کنترل نقش کامپیوتر • تحلی ل رگرس یون نیازمن د اس تفادة هنرمندان ه و هوشمندانه از کامپیوتر است. … • SAS, SPSS, S-plus, R, MATLAB, رگرسیون و مدل سازی • تحلی ل رگرس یون :یک تکنی ک آماری برای بررسی و مدل‌سازی ارتباط بین متغیرها • کاربرده ا :مهندس ی ،علوم فیزیکی و شیمیایی ،اقتصاد، مدیریت ،علوم زیستی و بیولوژیکی و علوم اجتماعی • تحلی ل رگرس یون شاید گس ترده‌ترین تکنیک آماری مورد استفاده می‌باشد. • تحلی ل رگرس یون این امکان را برای محق ق فراه م می‌کن د ت ا تغییرات متغی ر وابس ته را از طریق متغیرهای مس تقل پیش‌بین ی و س هم ه ر یک از متغیرهای مس تقل را در بی ن متغی ر وابس ته تعیی ن کند. تحلیل رگرسیون و ضریب همبستگی رگرسیون رابطۀ نزدیکی با ضریب همبستگی دارد ،بدین معنا که برای انجام رگرس یون باید ضریب همبس تگی را محاس به کرد. اگ ر میان متغیرهای مورد مطالع ه همبس تگی وجود داش ت تنه ا در این ص ورت اس ت که می‌توانی م از رگرس یون برای آزمون فرضیههای تحقیق استفاده نمائیم. ‌ تحلیل رگرسیون مفهوم رگرس یون برای اولی ن بار توس ط فرانس یس گالتون در س ال 1877 مورد اس تفاده قرار گرفت .او در مطالع ه خود نشان داد که ق د کودکان متول د شده از والدین بلندقامت گرایش به برگشت به متوسط قد افراد دارد. وی در یک مقالۀ مشهور اظهار داشت :اگرچه تمایل برای والدین بلندقد به داشتن فرزندان بلند قد و نیز والدین کوتاه قد به داشتن فرزندان کوتاه ق د وجود دارد ام ا متوس ط ق د بچه‌های والدین متعل ق ب ه ه ر طبق ة قدی معی ن ب ه طرف متوس ط ق د در کل جامع ه برگش ت یا گرایش دارد ()Regress تعبیر نوین تحلیل رگرسیون ال متفاوت از حال ت قب ل اس ت ب ه طور کل ی • تعبی ر جدید رگرس یون کام ً میتوان گفت: ‌ • تحلیلهای رگرس یون ب ه مطالع ۀ وابس تگی یک متغی ر (متغی ر وابس ته) ب ه ‌ میپردازد که ب ا تخمی ن یا یک یا چن د متغی ر دیگ ر (متغی ر توضیح ی) ‌ پیشبینی مقدار متوسط یا میانگی ن مقادیر متغیر نوع اول در حالتی که ‌ نمونهگیری ‌ مقادیر متغی ر نوع دوم معلوم یا معی ن شده باشن د (در میپذیرد. تکراری) صورت ‌ رسم خط رگرسیون تحلیل رگرسیون در مقام مقایسه با تحلیل رابطۀ علیت • هرچن د تحلیل‌های رگرس یون وابس تگی یک متغی ر ب ه س ایر متغیره ا را بررس ی می‌کن د ام ا الزام ًا بیانگ ر حال ت علی ت نمیباشد .بن ا ب ه گفت ه کندال و اس توارت یک رابط ۀ آماری ‌ هرچند قوی و واضح هرگز نمی‌تواند پایۀ ارتباط علی (سببی) ایدههای م ا از علی ت باید خارج از حیط ۀ آمار و قرار بگیرد‌ . ماالً از تئوری یا غیر آن حاصل شود. ال نمی‌توان گف ت که بارندگ ی ب ه عملکرد محص ول وابس ته • مث ً است. تفاوت عمدۀ همبستگی و رگرسیون • در رگرس یون فرض بر این اس ت که متغی ر وابس ته تص ادفی و متغیرهای توضیح ی دارای مقدار ثاب ت یا غیرتص ادفی (در نمونهگیری تکراری) می‌باشند .در همبس تگی فرض بر این ‌ است که هر دو متغیر تصادفی هستند. • ضریب همبس تگی قادر ب ه بیان رواب ط علّ ی و معلول ی بی ن متغیرها نیست. • اگر وابستگی متغیری تنها بر روی یک متغیر توضیحی بررسی شود ،چنی ن بررس ی‌ ب ه عنوان تحلی ل رگرس یون س اده یا دو متغیره معروف است. • اگر وابستگی یک متغیر بر روی بیش از یک متغیر توضیحی بررسی گردد ،تحت عنوان رگرسیون مرکب معرفی می‌گردد. رگرسیون خطی و غیرخطی • خطیبودن از نظر متغیرها ‌ ‏y 1   21 ‏y 1   212   3 1 • خطیبودن از نظر پارامترها ‌ ‏ 2 1 ‏y 1  جزء استوکاستیک (تصادفی) تابع رگرسیون جامعه جزء تص ادفی جامع ه ( ) uنماینده یا جانشین ی برای تمام ی متغیرهای حذف شده یا فراموش‌شده که بر متغیر وابسته اثر می‌گذارند ولی در مدل رگرسیون وجود ندارند (یا به دالیل گوناگون نمی‌توانند در مدل گنجانده شوند). ‏i ‏yi 1   2 i  ui اهميت جزء اخالل استوکاستیک و تعبیر آن جزء استوکاستیک نماینده‌ای برای تمامی متغیرهائی است که از مدل حذف شده اما مجموعاً بر yاثر می‌گذارد حال سؤال این است که چرا این متغیرها صریحاً در مدل معرفی نمی‌شوند؟ به بیان دیگر چرا یک مدل رگرسیونی مرکب با تمام متغیرهای ممکن بسط داده نمی‌شوند. دالیل فراوانی وجود دارد: .1ممکن است تئوری ناقص باشد یعنی از تأثیرگذاری بعضی از متغیرها بر متغیر وابسته بی‌اطالع باشیم. .2ممکن است راجع به بعضی از متغیرها داده‌های اندکی داشته باشیم. جمعآوری داده در مورد بعضی از متغیرها به نسبت تأثیر آنها در مدل ممکن است بسیار زیاد باشد. ‌ .3 .4به دلیل ماهیت تصادفی بودن متغیر وابسته ،توضیح کامل آن ممکن نیست و جزء اخالل می‌تواند آنرا منعکس کند. .5ممکن است در اندازه‌گیری خطا صورت گرفته باشد. .6ب ا تأس ی به قاعدۀ اُکام (توصیف راج ع ب ه پدیده‌ه ا حت ی االمکان س اده در نظر گرفت ه شود ،و اینکه خالف آن سادهتر بگیریم. ثابت نشده است) مطلوب است مدل رگرسیون را تا حد ممکن ‌ تخمین مدل رگرسیون دو متغیره روش حداقل مربعات معمولی )Ordinary Least Square (OLS برطب ق فروض اص لی ،روش حداق ل مربعات چن د خاص یت بس یار جال ب آماری دارد که یکی از مشهورترین و قویترین روشهای تحلیل رگرس یون را ب ه وجود آورده اس ت (این روش ب ه کارل فردریک گوس ،ریاضیدان نامی آلمان نسبت داده می‌شود). مشاهدات نمودار پراکندگی قاعدۀ کلی حداقل مربعات yi 1   2i  ui   yi 1   2 i  ei   yi  yi  ei  ei  yi  yi  ei e  e  e  e 1 2 3 4   2  2 Min e   yi  yi   yi  1   2 i 2 i   بفردی از و روش حداقل مربعات ،تخمینهای منحصر ‏ ‏ 2 1 را به نمونه ارائه شده ممکن مقدار را که کوچکترین ei2 بدهد ،مهیا می‌سازد. تخمين زننده‌های حداقل مربعات ‏ ‏    i2 yi2    i   i yi ‏ ‏ ‏ ‏ ‏ ‏1  2 2 2 ‏ i    i  ‏ ‏ ‏i y ‏ ‏ ‏ 2   2   2 ‏ i ‏ زنندهها خصوصیات جالبی دارند که عبارتند از: تخمين ‌ ‌ اين • • ال و منحص را ً برحس ب مقادیر قاب ل مشاهده بیان می‌شوند (مث ً در یک نمونه) زنهای نقطه‌ای هس تند یعن ی در نمون ه زنه ا ،تخمین‌ ‌ این تخمین‌ ‌ داده شده با ه ر تخمین‌زن فق ط مقدار منحص ر به فردی (نقطه) برای پارامت ر جامع ۀ مربوط ه ارائ ه می‌کن د (بنابراین خ ط رگرسیون را می‌توان به آسانی برازش نمود) فرضیات اساس روش حداقل مربعات • اگر هدف ما تنها تخمین 1و  2باشد ،روش OLSکافی است اما به یاد داریم که در بدستآوردن 1و  2نیست بلکه هدف استنتاجاتی دربارۀ ‌ تحلیل رگرسیون هدف تنها 2 1و واقعی می‌باشد. • برای رس یدن ب ه این هدف ن ه تنه ا باید شکل تبع ی مدل را تعیی ن کنی م بلکه باید فرضیات معینی دربارۀ چگونگی بوجودآمدن  iو uiرا نیز مطرح سازیم: ‏yi  i   2 i  ui • اين معادله نشان می‌دهد که هم به iو  iهم به Uiبستگی دارد .بنابراین تا زمانی که ندانیم  iو Uiچگونه بدست می‌آیند هیچ راهی برای دستیابی به استنتاجات آماری دربارۀ و iهمچنین 1و  2نخواهیم داشت .از این رو فرضیات مبتنی بر متغیر  iو جزء خطا برای تفسیر معتبری از تخمینهای رگرسیون اهمیت دارند. آنچه به عنوان مدل رگرسیون خطی عمومی ،گوسی ،کالسیک یا میباشد ،مبتنی بر فرضیات زیر است :استاندارد معروف ‌ فرض :1میانگین uiها صفر است اين فرض بيان مي‌كند كه مقدار میانگین‌ uiها برحسب Xiمفروض صفر است. ‏Eui  i  0 فرض :2عدم وجود خودهمبستگی بین uها ‏ ‏ ‏covui ,uj  E ui  E ui   ui  Euj  Euiuj  0 اگر بین uها حالت الف یا ب وجود داشته باشد آنگاه خودهمبستگی یا همبستگی پیوسته وجود خواهد داشت. فرض :3یکسانی (همسانی) واریانس Uiها 2 2 ‏varui xi   E ui  E ui    E ui  0 این فرض بیان می‌کند که جامعۀ Yمتناظر با مقادیر مختلف Xواریانس یکسان دارند. در مقاب ل این حال ت شکل زیر ،واریان س شرط ی جامع ۀ yهمراه ب ا افزایش مقدار Xافزایش می یابد ،این حالت به ناهمسانی واریانس و یا ناهمسانی در پراکندگی معروف است. فرض :4کوواریانس صفر بین و Ui , Xi ‏cov ui , xi  E ui xi  0 فرض نمودیم که xو ( uکه می‌توان د تأثی ر تمام متغیرهای حذف شده را نشان میباشن د ام ا اگ ر Xو uهمبس ته ده د) دارای تأثیرات جمع‌پذیر و مجزا بر ‌ y باشند .تشخیص تأثیر خاص و مجزای هر کدامشان بر yممکن نیست .بنابراین اگر Xو uبه طور مثبت همبستگی داشته باشند Xبا افزایش uافزایش و با مییابد به همین شکل اگر Xو uبه طور منفی همبسته باشند کاهش uکاهش ‌ Xبا افزایش uکاهش و با کاهش uافزایش می‌یابد و به هر ترتیب جداکردن تأثیر Xو uبر Yمشکل است. فرض :5مدل رگرسیون دقیق ًا تصریح شده است (عدم وجود خطای تصریح یا تورش) سؤاالت فوق بسیار مهمند چراکه با حذف متغیرهای اصلی از مدل ،انتخاب شکل تبعی غلط و یا مطرح کردن فرض‌های آماری نادرست دربارۀ متغیرهای مدل ،اعتبار تفسیر رگرسیون تخمین‌زده شده ،زیر سؤال خواهد رفت. از میان تمامی فرضها ،این فرض انعطاف‌ناپذیرترین و شاید در نظر اول دارای کمترین محل اعراب باشد. یک مدل رگرس یون در یک تحقیق ب ا تص ریح مدل آ ن در رابط ه ب ا پدیده‌های مورد نظ ر شروع می‌شود. میآیند عبارتند از: بعضی از سؤاالت مهم که در تصریح مدل پدید ‌ .1چه متغیرهائی باید در مدل جای گیرند؟ .2شکل تبعی مدل چیست؟ آیا این مدل از نظر پارامترها خطی است یا از نظر متغیرها و یا هردو؟ فرضهای احتمالی ارائه شده در مورد Yi ،و Xiو uiهای درون مدل چه می‌باشند؟ ‌ .3 متأس فانه در عم ل ،شخ ص ب ه ندرت از متغیرهای ص حیحی که باید در مدل منظور شود ،شکل تبع ی ص حیح و یا فرض احتمال ی ص حیح در مورد متغیرهای وارد شده در مدل اطالع دارد. بنابراین در عم ل کارشناس از بعض ی قضاوت‌ه ا در انتخاب تعدادی از متغیرهای فرضه ا را در ‌ واردنشده در مدل یا شکل تبع ی مدل اس تفاده کرده و برخ ی میکش د و در انتخاب مورد ماهی ت تص ادفی متغیرهای مشمول در مدل پی ش ‌ مدل صحیح برای تحلیل تجربی تا حدی مستلزم آزمون و خطاست. پراکندگی منحنی فیلیپس منحنی فیلیپس 1 Yi 1   2 Xi Yi 1   2 Xi زنندههای حداقل مربعات :قضیۀ گوس- خصوصیات تخمین‌ ‌ مارکف یک تخمین‌زن 2را زمانی می‌توان بهترین تخمین‌زن بدون تورش خطی ( )BLUEاز 2دانست که: تخمینزن خط ی باشد .یعن ی تابع ی خط ی از یک متغی ر تص ادفی مانن د متغی ر ‌ .1 وابستهYدر مدل رگرسیون باشد. ˆ ‏E( 2)  2 تخمینزن بدون تورش باشد ‌ .2 تخمينزن در بی ن تمام تخمین‌زننده‌های بدون تورش خط ی ،حداق ل واریان س را ‌ .3 تخمینزن کارا معروف ‌ داشته باشد (تخمین‌زن بدون تورش با حداقل واریانس به است). The Gauss-Markov Theorem: are the best linear unbiased estimators (BLUE). قضیۀ گوس -مارکف فرضهای مدل کالسیک رگرسیون خطی ،تخمین‌زننده‌های حداقل ‌ با توجه به مربعات در بین تخمین‌زننده‌های خط ی ،بدون تورش و دارای حداق ل میباشند. واریانس یعنی ‌ BLUE ضرائب تعیین ( r2معیار خوبی برازش) و ضریب همبستگی r2 ضریب همبستگی: .1 .2 .3 .4 .5 .6 .7 نفی اشد. rم ‌‌تی واند م ثبتیا م ب این کمیت بین دو مقدار +1و -1می‌باشد. این کمیت ماهیت ًا قرینه می‌باشد یعنی ضریب همبستگی بین xو yیعنی rxyمعادل ضریب همبستگی بین yو ) x (ryxاست. این کمیت مستقل از مبدأ و مقیاس اندازه‌گیری است. اگر xو yاز لحاظ آماری مستقل باشند ضریب همبستگی بین آنها صفر است و r = 0به این معنا نیست که دو متغیر مستقلند (قسمت hشکل صفحه بعد) این کمیت صرفاً معیاری جهت همبستگی خطی یا وابستگی خطی است و برای توصیف ارتباطات غیرخطی قابل استفاده نیست .بنابراین در قسمت Y=X2hبیانگر یک ارتباط دقیق است اما میزان rمعادل صفر است. ال اشاره ش د بیانگ ر هرچندکه rمعیار همبس تگی خط ی بی ن دو متغی ر اس ت ول ی همانطور که قب ً هیچگونه رابطۀ علت و معلولی نمی‌باشد. ‌ الگوهای همبستگی ضریب تعیین در زمین ۀ رگرس یون r2 ،معیار پرمعناتری از rاس ت چرا که r2 نس بت تغییرات متغی ر وابس ته توضی ح داده شده ب ه وس یلۀ متغیرهای توضیح ی را ارائ ه می‌ده د درحالیکه rفاق د چنی ن خص وصیتی اس ت .ب ه عالوه تعبیر)= r (Rدر یک مدل رگرسیون مرکب زیر سؤال می‌باشد. کوشش برای حداکثرکردن R 2 • گاهی محققان سعی در حداکثرکردن R2دارند یعنی انتخاب مدلی که باالترین R2را به دست می‌دهد • اما انجام این کار ممکن اس ت خطرناک باشد زیرا در تحلیل رگرسیون هدف ما آن نیست که تنها یک R2باال به دست آوریم. • تخمینهای قابل اطمینانی از ضرائب حقیقی رگرسیون جامعۀ اصلی و استنباط ‌ بلکه هدف بدست آوردن آماری دربارۀ آنهاست. • در تحلیل‌های تجرب ی بدس ت آوردن یک R2بس یار باال چندان معمول نبوده بلکه حت ی گاه ی برخ ی از تخمینزده شدۀ رگرس یون از لحاظ آماری بی‌معن ی بوده یا دارای عالمت‌هائ ی برخالف انتظارات ‌ ضرائ ب قبلی هستند. • بنابراین محقق باید دقت بیشتری دربارۀ ارتباط منطقی یا تئوریکی متغیرهای توضیحی یا متغیر وابسته و معنیداری آماری آنها داشته باشد. ‌ • اگر R2باال بدست آوریم خوب خواهد بود اما اگر R2پایین باشد این امر به معنی بدی مدل نمی‌باشد. فرض نرمال: مدل رگرسیون خطی نرمال کالسیک توزیع احتمالی اجزاء اخالل ui • برای کاربرد روش حداق ل مربعات معمول ی ( )OLSدر مدل کالس یک رگرس یون خط ی ،هی چ فرض ی در مورد توزیع احتمالی جزء اخالل ui ارائه نکردیم. • تنها فروضی که در مورد uiمدنظر قرار گرفت عبارت بودند از این‌که اجزا مذکور دارای امید صفر ،عدم همبستگی و واریانس ثابت هستند. • اگ ر هدف م ا تنه ا تخمی ن پارامتره ا باش د در این‌ص ورت روش OLSکاف ی خواه د بود ام ا تأکی د بر تخمی ن تنه ا یکی از جنبه‌های استنتاج آماری است و جنبۀ دیگر آزمون فرضیه می‌باشد. • از آنج ا که هدفمان ه م تخمی ن پارامتره ا و ه م آزمون فرضی ه اس ت ،لذا احتیاج ب ه تعیی ن توزیع احتمال ی جزء اخالل uiخواهیم داشت. فرض نرمال بودن • ميانگین ‏E ui  0 ‏Eui2   2 • واریانس ‏Euiuj  0 • کوواریانس ui ، uj 2 ) ui  N(0, طبق قضیۀ مشهور آماری حدی مرکزی می‌توان نشان داد که اگر با تعداد زیادی از متغیرهای مستقل و تصادفی که دارای توزیع احتمالی یکسانی هستند مواجه باشیم ،در این صورت به استثناء چند حالت خاص ،ب ا افزایش تعداد متغیره ا به سمت بی‌نهایت توزیع مجموع آنها به سمت توزیع نرمال میل می‌کند. خصوصیت تخمین‌زننده‌های OLSتحت فرض نرمال بودن .1 .2 .3 .4 .5 بدون تورش هستند دارای حداقل واریانس هستند سازگاری :یعنی همانطور که حجم نمونه به سمت بینهایت افزایش می‌یابد، زنندهها نیز به مقادیر جامعه‌شان نزدیک می‌شوند تخمین ‌ ‌ ‏1به طور نرمال توزیع شده است ‏ ‏ 2به طور نرمال توزیع شده است ‏2 .6 عبارت  N  2 از توزیع کای‌دو با درجۀ آزادی ( )N-2تبعیت می‌کند. ‏ ‏و مستقل از  2توزیع شده‌اند. .8 زنندههای بدون تورش خطی یا غیرخطی دارای حداقل و در گروه تخمین‌ ‌ ‏1 ‏2 واریانس هستند. .7 2 1 2 زنندههای بدون تورش ( )BLUEهستند. تخمین ‌ ‌ زنندههای حداقل مربعات بهترین تخمین ‌ ‌ میتوان گفت که بنابراین ‌ آمار آمار کالسیک تخمین تخمین نقطه‌ای تخمین فاصله‌ای آمار بیزین آزمون فرضیه ساخت فاصلة اطمینان رگرسیون دومتغیره: فاصلهای و آزمون فرضیه ‌ تخمین فاصلة اطمینان میبایس ت در معنای از آنجائیکه فاص لۀ اطمینان تص ادفی اس ت ،احتمالهای بدس ت آمده ‌ درازمدت فهمیده شون د ،یعن ی نمونه‌گیری تکراری ب ه طور مشخص‌تر ب ه این معن ی نمونهگیری تکراری ،فواصل اطمینان ‌ است که :اگر در ‏ ‏ ‏ ‏pr  2      2   1  ‏ ‏  آنگاه در درازمدت به طور متوسط به تعداد زیاد ساخته شوند ‌ براساس احتمال ‏1   مورد از تعداد کل موارد ،مقدار حقیق ی پارامت ر را در بر چنین فواص لی در ‏1   میگیرند. ‌ آزمون فرضیه و انتخاب سطح معنی‌داری خطای نوع اول :احتمال ردکردن فرضیۀ درست. خطای نوع دوم :احتمال قبول فرضیۀ نادرست. براساس هزینۀ هر کدام از خطاهای فوق ،محقق اقدام به انتخاب سطح معنی‌داری خواهد نمود. • نقض فروض مدل کالسیک مدل کالسیک رگرسیون خطی نرمال براساس چند فرض ساده شده به شرح زیر است: .1فرض :1میانگین شرطی جزء اخالل جامعه مشروط به مقادیر مفروض متغیرهای توضیحی (xها) صفر است. .2فرض :2واریانس شرطی uiثابت یا همسان است. .3فرض :3خودهمبستگی در اجزا اخالل وجود ندارد. .4فرض :4متغیرهای توضیحی غیرتصادفی‌اند .حتی اگر تصادفی هم باشند ،مستقل از اجزا اخالل uiتوزیع شده‌اند. .5فرض :5بین متغیرهای توضیحی (xها) همخطی مرکب وجود ندارد. .6فرض ui :6ها به طور طبیعی با میانگین و واریانس داده شده در فروض 1و 2توزیع شده‌اند. .7فرض :7مدل رگرسیون به طور صحیح تصریح شده است ،یعنی تورش تصریح وجود ندارد. با این فروض دیدیم که تخمین‌زنهای حداقل مربعات معمولی ( )OLSضرائب رگرسیون ،بهترین تخمین‌زنهای میباشند. بدون تورش خطی ‌ BLUE • • • • فروض 4 ،1و 6را به دالیل زیر به طور مفصل مورد بحث قرار نخواهیم داد: فرض :1امید ص فر جزء اخالل :اگ ر این فرض تأمین شود نمی‌توان عرض از مبدأ اص لی را تخمین زد و چون در بسیاری از حالت‌های کاربردی ،جزء عرض از مبدأ اهمیت ناچیزی دارد چندان تأثیری نخواهد داشت. فرض :4حال ت تص ادفی‌بودن متغیرهای توضیح ی :اگ ر xه ا ب ا وجود تص ادفی‌بودن ب ه آنگاه برای تمام مقاص د کاربردیx ،ه ا را می‌توان طور مس تقل از uه ا توزیع شون د ‌ غیراستوکاستیک فرض کرد. فرض :6نرمال بودن :uاگ ر هدف م ا ص رف ًا تخمین باش د ،این فرض ضروری نیس ت. فرض نرمال بودن به منظور آزمون فرضیه و پیش‌بینی بسیار مهم است. همخطی ‏Multicollinearity ‏x3 ‏x2 50 10 75 15 90 18 120 24 150 30 یکی از فروض مدل کالس یک رگرس یون خط ی این اس ت که هیچ‌گون ه هم‌خط ی مرکب بی ن متغیرهای توضیح ی موجود در مدل وجود ندارد. همخطی توجه داشته باشید که ‌ تنها ارتباطات خطی بین متغیرهای xرا شامل می‌شود و ارتباطات غیرخطی بین آنها را در بر نمی‌گیرد. ‏y  0  1x1   2xi2   2xi3  ui اگ ر هم‌خط ی وجود داشت ه باش د ضرائ ب رگرس یونی متغیرهای xنامعی ن و انحراف معیارشان بی‌نهایت است. (هم‌خطی‌کام ل) هم‌خط ی ویژگی‌های BLUEبودن تخمینها را نقض نمی‌کند. ‌ نتایج عملی هم‌خطی الف -بزرگی واریانس و کوواریانسهای تخمین‌زنهای OLS ال خطای نوع دوم) ب -فواصل اعتماد عریض‌تر :احتمال قبول شدن یک فرضیۀ غلط (مث ً بتهای غیرمعنادار :rمقادیر tکوچ ک می‌شون د و فرضی ۀ ص فر ب ه معنای ص فر‌بودن ج -نس ‌ پارامترهای جامعۀ واقعی مورد قبول واقع می‌شود. د R2 -باال اما تعداد اندک نسبت‌های معنادار. هـ -حساسیت تخمین‌زنهای OLSو خطای معیار آنها نسبت به تغییرات اندک در داده‌ها کشف هم‌خطی الف- .1در هم‌خطی سؤال از درجه است نه از نوع .تمایز معناداری بین حضور و عدم حضور هم‌خط ی وجود ندارد ،بلکه تمایز بی ن درجات گوناگون آ ن است. .2از آنجایی که هم‌خط ی ب ه شرایط متغیرهای توضیح ی برمی‌گردد که فرض شده غیرتص ادفی باشن د لذا این حال ت شکل ی از نمون ه اس ت ن ه جامع ه بنابراین ماآزمون برای هم‌خط ی ص ورت نمی‌دهی م ،بلکه می‌توان درجه‌اش را در نمونۀ مشخص اندازه‌گیری نمود. ب- معنیدار R2 .1باال اما تعداد کم نسبتهای ‌ t .2همبستگی شدید بین دوبدو متغیرهای توضیحی .3امتحان ضرائب جزئی .4رگرسیونهای معین .5ریشۀ مشخصه ( )Eigenvalueو شاخص وضعیت ()Condition Index در برنامۀ SASاز ریشۀ مشخصه و شاخص وضعیت برای تشخیص هم‌خطی استفاده می‌کنند. رفع مشکل هم‌خطی: قاعدۀ محکم و دقیقی جهت چاره‌جوئی مشکل وجود ندارد ،چراکه هم‌خطی الزاماً یک مشکل نمونه‌ای است. .1اطالعات قبلی (تئوریکی) (دادههای مرکب) ‌ دادههای مقطعی و سری‌های زمانی .2ترکیب کردن ‌ .3حذف متغیرها و تورش تصریح .4تبدیل متغیرها دادههای جدید یا اضافی (افزایش حجم نمونه) ‌ .5 ناهمسانی واریانس Heteroscedasticity یکی از مهمترین فروض مدل رگرسیون خطی کالسیک این است که اجزاء اخالل uiکه بر تابع رگرسیون جامعه ظاهر می‌شوند ،دارای واریانس همسان ‏E(ui )  2 با افزایش یک متغیر (درآمد) متوسط متغیر دیگر (پسانداز) افزایش می‌یابد ‌ . »ن اهمسانیواریانس« هستند.  تخمینزن  2هنوز ‌ • اگ ر فرض ناهمس انی را جایگزین فرض همس انی نمائیم BLUEهس ت ام ا دیگ ر کارا یا بهترین نیس ت و دارای حداق ل واریان س نیز نمیباش د در این حال ت از روش تخمین معروف ب ه حداق ل مربعات تعمیم‌یافت ه ‌ ( )GLSاستفاده می‌نمائیم. نتایج کاربرد روش OLSدر شرایط وجود ناهمسانی واریانس • فاصلۀ اطمینان براساس بیش از حد الزم بزرگ خواهد شد و در نتیجه آزمون‌های tو Fاحتماالً نتیج غلطی به ما خواهند داد. کشف ناهمسانی واریانس .1 • روش ترس یمی :ابتدا رگرس یون را براس اس فرض عدم ناهمس انی تحلی ل کرده و س پس تخمینزده شده ei2را ‌ مجذور باقیمانده‌های مورد بررس ی قرار داد ت ا ببینی م چ ه الگوی سیستماتیک و منظمی را نشان می‌دهند. واریانس جزء اخالل به طور خطی یا متغیر x مربوط است. .2 .3 .4 .5 .6 آزمون پارک :پارک روش گرافیکی را در قالب فرمول بیان داشته است. آزمون گلدفلد -کوانت آزمون گلچس آزمون بروج پاگانت آزمون وایت خودهمبستگی • یکی از فروض مه م مدل کالس یک این است که خودهمبستگی سریالی بین اجزاء اخالل ی که در تاب ع رگرس یون جامع ه وارد می‌شود وجود ندارد. • ماهی ت خودهمبس تگی :همبس تگی بی ن اعضای س ری‌های مشاهدات ی اس ت که در زمان (س ریهای زمان ی) یا مکان (داده‌های مقطعی) ردیف شده‌اند. ‏E(uiuj ) 0 i  j اگ ر محص ول در یک فص ل کم باش د دلیل ی بر کم بودن محصول در فصل دیگر نمی‌باشد (عدم خودهمبستگی) تخمین OLSدر حالت وجود خودهمبستگی • • • در حال ت خودهمبس تگی تخمین‌زن GLS خص وصیت BLUEداشت ه و تخمین‌زن OLS چنین خص وصیتی ندارد .تخمین‌زن OLSاز میکند. اطالعات موجود بیشترین استفاده را ‌ درحال ت وجود خودهمبس تگی نیز همانن د حال ت ناهمس انی ،تخمین‌زنهای OLSخط ی و بدون تورش و لذا س ازگارند ول ی کارا نیس تند (یعن ی حداقل واریانس را ندارند) فواص ل اعتماد بزرگت ر از حال ت معمول خواه د بود ( OLSنسبت به )GLS تخمین OLSبدون در نظر گرفتن خودهمبستگی – – – احتما ًال واریان س باقیمانده مقدار واقع ی س یگما ب ه توان دو را کمت ر از ح د تخمین می‌زند. در نتیجه R2بیش از حد تخمین زده می‌شود. آزمونهای معنی‌داری tو Fمعتبر نیستند و اگر آنها را بکار ببریم نتایج بسیار غلط ی در مورد معنی‌داری آماری ضرایب تخمین‌زده شدۀ رگرس یون به‌دس ت خواهیم آورد. کشف خودهمبستگی: روش ترسیمی.1 آزمون تسلسل.2 آزمون دوربین واتسون :مشهورترین آزمون تشخیص همبستگی سریالی است DW.3 فروض زیربنایی آزمون D.W .1مدل رگرسیون دارای جزء عرض از مبدأ است .2متغیرهای توضیحی غیرتصادفی هستند .3اجزاء اخالل به وسیلۀ الگوی خود رگرسیونی مرتبۀ اول حاصل می‌شوند. وقفهای از متغیر وابسته .4مدل رگرسیون شامل مقادیر با ‌ به عنوان یکی از متغیرهای توضیحی نیست. .5هیچ مشاهدۀ مفقوده‌ای در داده‌ها وجود ندارد. تصریح مدل • یکی از فروض کالسیک ،تصریح مدل بود به عبارت دیگر فرض بر این بود که تورش یا خطای تصریح در مدل وجود ندارد .این موضوع بسیار گسترده و پیچیده می‌باشد و بسیاری از مباحث آن باالتر از سطح مفروض ما می‌باشد. این قسمت دربرگیرندة مسائل زیر است: • .1 .2 .3 .4 .5 .6 مدل خوب یا صحیح متضمن چه خصوصیاتی است؟ فرض کنید که یک مدل صحیح برای تحلیل یک مسألة خاص ارائه شده است اما به علت در دسترس نبودن آمار و ارقام ،سهل‌انگاری ،مالحظات هزینه‌ای یا سستی ،مدل متفاوتی را بکار بردیم و بنابراین نسبت به مدل صحیح مرتکب خطای تصریح شده‌ایم .حال سؤال این است که در عمل وقوع چه نوعی از شکل‌های مختلف خطاهای تصریح وجود دارد؟ نتایج انواع مختلف خطای تصریح کدامند؟ طرق کشف این نوع خطاها کدامند؟ اگر به ارتکاب خطای تصریح پی بردیم چه راههایی برای دستیابی و برگشت به مدل صحیح وجود دارد؟ در 5مورد باال فرض بر این بود که یک مدل صحیح وجود دارد و ما مایل به دانستن مشکالت عارض شده در اثر کاربرد مدل دیگری بودیم اما اگر اصال ندانیم که کدام مدل صحیح است دچار خطای تعیین غلط مدل می شویم که با خطای نوع قبلی یعنی خطای تصریح متفاوت است. خصوصیات یک مدل خوب • • • • • قلت منطقی متغیرهای توضیحی :یک فرضیه (مدل) زمانی با ارزش و مهم خواهد بود که مقدار زیادی از تغییرات را به وسیلة تعداد کمی از متغیرها بتوان توضیح داد. قابلیت تشخیص :برای مجموعه داده های معین ،پارامترهای تخمین زده شده باید مقادیر منحصر بفردی را به دست دهند به عبارت دیگر تنها یک تخمین برای هر پارامتر مشخص به دست آید. خوبی برازش: سازگاری با تئوری قدرت تعمیم دهی و پیشنگری :تنها آزمون مناسب برای اعتبار یک فرضیه (مدل) مقایسة پیش بینی آن با تجارب است. انواع خطای تصریح • • • • حذف یک متغیر مهم واردکردن متغیر غیرالزم درنظر گرفتن یک شکل تبعی غلط خطای در اندازه گیری نتایج خطای تصریح • حذف یک متغیر مهم: – ضرایب رگرسیون اشتباه برآورد می شوند (تورشدار ،ناسازگار) – واریانس جزء اخالل اشتباه تخمین زده می شود. – نهایت ًا فاصلة اطمینان و آزمون فرضیه نتایج گمراه کننده ای را راجع به معنادار بودن آماری پارامترهای تخمین زده شده به دست می دهند. • لحاظ کردن یک متغیر نامربوط – – – – تخمینها ناتور و ناسازگارند واریانس خطا درست برآورد می شود. آزمون فرضیه و فاصلة اعتماد معتبر می باشند. به طور کلی ضرایب برآوردشده غیرکارا هستند یعنی واریانس آنها عموم ًا بزرگتر از واریانسهای ضرایب حقیقی می باشند( .دقت کم در استنتاجهای احتمالی پارامترها) (احتمال ایجادشدن مشکل همخطی را نیز زیاد می کند) (درجة آزادی را کم می کند) آزمونهای کشف خطای تصریح • کشف وجود متغیرهای غیرالزم – آزمون معنادار بودن ضریب متغیر اضافه (آزمون )F • آزمونهای راجع به متغیرهای حذف شده و شکل تبعی غلط – – – – – – استفاده از باقیمانده ها (مالحظة گرافیک این باقیمانده ها) آزمون Resetرمزی آزمون نسبت راستنمایی آزمون والد آزمون ضریب الگرانژ آزمون هاسمن استفاده از باقیمانده‌ها (مالحظة گرافیک این باقیمانده‌ها) رگرسیون بر روی متغیرهای موهومی • در بسیاری از تحلیل‌های رگرسیونی ،متغیر وابسته نه تنها تحت‌تأثیر متغیرهای کمی (مثل تولید ،میزان کود مصرفی )...،با مقیاس‌های متداول است ،بلکه از متغیرهای ماهیتاً کیفی (جنس ،نژاد )... ،نیز تبعیت می‌کند. • نظر به اینکه متغیرهای کیفی عموماً داللت بر وجود یا عدم وجود کیفیت یا صفتی دارند ،لذا یک روش برای کمی کردن این صفات‌،درنظر گرفتن متغیرهای ساختگی با قبول دو مقدار ضفر و یک می‌باشد که صفر بیانگر عدم وجود آن صفت و یک حاکی از وجود آن می‌باشد. به این ترتیب متغیرهایی که این مقادیر صفر و یک را اختیار می‌کنند ،متغیرهای موهومی ( )Dummy Variableنام دارند. • اسامی دیگر این متغیرها عبارتند از متغیرهای داللت‌کننده بر یک صفت ،متغیرهای دوتایی، متغیرهای طبقه‌ای ،متغیرهای کیفی ،متغیرهای منقسم به دو ،متغیرهای مجازی. • متغیرهای موهومی به همان سادگی متغیرهای کمی در تحلیل رگرسیونی به کار می‌روند. • اگر چنانچه یک مدل رگرسیونی تنها بر حسب متغیرهای توضیحی موهومی یا کیفی بیان شده باشند ،آن را مدل آنالیز واریانس می‌نامند. • در بیشتر تحقیقات اقتصادی ،معموالً یک مدل رگرسیون شامل چندین متغیر توضیحی می‌باشد که تعدادی از آنها کمی و بقیه کیفی می‌باشند ،این گونه مدل‌های رگرس یونی که شام ل دو نوع متغیرهای کم ی و کیف ی هستند را مدل‌های آنالیز کوواریانس ( )ACOVمی‌نامند. قاعدة‌کلی برای تعداد متغیرهای موهومی :چنانچه متغیر کیفی موردنظر دارای mطبقه باشد ،آنگاه بایستی فقط به تعداد m-1متغیر موهومی در مدل منظور شود در غیر اینصورت در دام متغیر موهومی گرفتار خواهیم شد (همان حالت ایجاد همخطی کامل بین متغیرهای موهومی) رگرسیون بر روی یک متغیر کمی و یک متغیر کیفی با بیش از دو طبقه پيش بيني تلفات برداشت گندم و تحليل داده ها به روش مدل متغيرهاي موهومي (کد مقاله)653 احسان مصدری] ، [1محمد حسین عدالت] ، [2محمد جواد خلیلی] ، [3حمید طاهرپور کالنتری][4 مجموعه مقاالت پنجمین کنگرة ملی مهندسی ماشین‌‌های کشاوزی و مکانیزاسیون • مدل متغيرهاي موهومي گونه اي از مدل هاي رگرسيوني است که بوسيله آن مي توان اث ر متغيرهاي کيف ي را بر روي متغير وابس ته س نجيد .اي ن مدل ه ا م ي توانن د فق ط از متغيرهاي موهوم ي (کيف ي) تشکيل شده باش د که در اي ن ص ورت آ ن را مدل آناليز واريانس مي نامند و يا مي تواند ترکيبي از متغيرهاي موهومي و کمي باشد که در اين صورت آن را مدل آناليز کوواريانس مي نامند. • در اين مدل تمام متغيرهاي کيفي را بايستي با استفاده از روش مناسب به صورت صفر و يک تبديل کرد .براي تخمين مدل در اين مطالعه از يک تابع خطي به شکل زير استفاده شده است. • که در ان نشان دهنده متغيرهاي مس تقل و نشان دهنده متغي ر وابس ته و مقادير و ضراي بي اس ت که در پ ي تخمي ن زدن هس تيم .اي ن مدل ب ا اس تفاده از روش OLSب ه راحتي قابل تخمين است .اما شيوه تفسير ضرايب متغيرهاي موهومي متفاوت خواهد بود. • متغيرهاي مستقل وارد شده در اين مدل جهت تخمين رابطه ريزش شامل منطقه ،واريته گندم ،مدل کمباي ن ،نوع کش ت ،عملکرد ،عم ر کمباي ن ،تاري خ برداش ت و س اعت ميباشد .متغي ر وابس ته درص د ريزش اس ت که حاص ل جم ع ربزش عمليات برداش ت ‌ برداشت و ريزش طبيعي محصول مي‌باشد. y   Taybad.Taybad  Khaf.Khaf  Torbatjam.Torbatjam  Roshan.Roshan  Sradary.Sardary ‏  Gaskojen.Gaskojen ‏  Abideym.Abideym ‏  Model.Model  Omr.Omr Tarikh.Tarikh  Saat.Saat • متغير منطقه داراي چهار حالت مشهد ،تربت جام ،خواف و تايباد مي باشد که از اين ميان منطقه مشهد ب ه عنوان وضعي ت پاي ه انتخاب شده و س اير مناط ق ب ه ترتي ب ب ا متغي ر هاي Torbatjam، Khafو Taybadوارد الگو مي شود .در اين صورت چنانچه مقادير هر سه ناحيه برابر صفر باشد نشان دهنده شهرس تان مشه د ،اگ ر متغي ر Torbatjamبرابر ي ک باش د و س اير متغيره ا ص فر باشن د نشان دهنده تربت جام و اگر متغير Khafبرابر يک باشد و ساير متغيرها صفر باشد نشان دهنده شهرستان خواف و • در نهاي ت اگ ر متغي ر Taybadبرابر ب ا ي ک و س اير متغي ر ه ا ص فر باش د نشان دهنده شهرس تان تايباد خواهد بود. ب ه عبارت س اده ت ر براي ه ر شهرس تان ي ک متغي ر کيف ي تعري ف شده اس ت که مقدار يک ،نشان دهنده برداشت در آن شهرستان و مقدار صفر نشان دهنده برداشت در يک شهرستان ديگر مي باشد .براي هر مشاهده حداکثر يک متغير برابر با يک مي شود و ساير مناطق صفر است .همانطور که قبال گفته شد اگر مقدار هر سه متغير صفر باشد نشان دهنده شهرستان پايه يعني مشهد است. • ب ه همي ن ترتي ب براي واريت ه گندم که شام ل چهار رق م فالت ،روش ن ،س رداري و گاس كوژن اس ت ،واريت ه فالت ب ه عنوان واريت ه پاي ه انتخاب شده و ارقام روش ن ،س رداري و گاس کوژن ب ه وس يله متغيرهاي کيف ي Roshan ، Sardaryو Gaskojenوارد الگ و شده اس ت .مدل هاي کمباي ن شام ل جاندي ر و س هند S68است که به وسيله يک متغير کيفي با نام Modelوارد الگو شده است .مقدار يک نشان دهنده اس تفاده از کمباي ن جاندي ر و مقدار ص فر نشان دهنده کمباي ن S68اس ت .نوع کش ت شام ل دو وضعي ت آبي و ديم است که به وسيله متغير Abideymمشخص شده است مقدار يک نشان دهنده کشت آبي و مقدار صفر نشان دهنده کشت ديم است. • ب ه اي ن ترتي ب متغيرهاي مس تقل کيف ي شام ل منطق ه ،واريت ه گندم ،نوع کش ت و مدل کمباي ن وارد الگ و ميشوند ،ساير متغيرها شامل عمر کمباين ،تاريخ برداشت و ساعت برداشت متغيرهاي کمي هستند که به ‌ ميشوند. ترتيب با نام هاي Omr ، Tarikh ، Saatمعرفي ‌ • متغير Omrبرحسب سال ،متغير Tarikhبرحسب شماره روز از ابتداي سال 84و متغير Saatبرحسب فاصله زماني از ساعت 12شب که مقداري بين صفر تا يک مي باشد در نظر گرفته شده است. ميشود. معنيداري کلي رگرسيوني با استفاده از آزمون Fو معني داري ضرايب با استفاده از آزمون tبررسي ‌ ‌ رگرسیون بر روی متغیر وابستة موهومی • در مدل‌های رگرسیونی دارای متغیر موهومی ،این فرض ضمنی وجود داشت که متغیرهای توضیحی می‌توانند کمی ،کیفی یا ترکیبی از آن دو باشند .در حالیکه متغیر به هر حال بایستی قابل اندازه‌گیری کمی باشد. • در این قس مت مدل‌های رگرس یونی مورد نظ ر قرار می‌گیرن د که در آنه ا متغیر وابسته یا تابع ،خود ماهیتاً بیانگر دو گروه است که هر یک مقادیر 0و 1را اختیار می‌کنند. ًً ًً :عموم ًا برای تخمین این مدل‌ها سه روش وجود دارد .1 .2 .3 مدل احتمال خطی )linear probability model (LPM مدل الجیت ()Logit مدل پروبیت ()Probit ‌Nهای معادالت همزمان مدل • بسیاری از روابط آماری به وسیلة مدل‌های تک معادله‌ای قابل تبیین هستند .در این مدل‌ها یک متغیر (متغیر وابسته) به عنوان تابعی خطی از یک یا چند متغیر دیگر (متغیرهای توضیحی) درنظر گرفته می‌شوند .به این ترتیب به طور ضمنی فرض بر این است که رابطة علْی (درصورت وجود بین دو متغیر xو yیکطرفه می‌باشد یعنی متغیرهای توضیحی حکم علت و متغیر وابسته حکم معلول را دارا می‌باشد. • اما مواردی وجود دارد که با جریانی دوطرفه از رابطة علی بین متغیرها مواجهیم یعنی یک متغیر در عین تأثیرگذاری بر متغیر(های) دیگر ،از آن (آنها) نیز تأثیر می‌پذیرد .بدیهی است در این حالت ،تحلیل رگرسیونی قبل ( )OLSبرای ال بهم وابسته‌اند .به مطالعة چنین وضعی مناسب نخواهد بود چرا که دو متغیر متقاب ً عبارت دیگر در این حالت به دو معادله احتیاج خواهیم داشت و همین ضرورت است که ما را متوجه مبحث معادالت همزمان می‌کند. • اگر در این حالت از سایر معادالت در سیستم چشم‌پوشی نماییم و پارامترهای هر معادله را به وسیلة روشی مانند حداقل مربعات معمولی تخمین بزنیم ،این تخمین‌ها نه تنها تورشدار بلکه ناسازگار نیز خواهند بود چون یکی از فروض قاطع روش ، OLSداشتن توزیع مستقل متغیرهای توضیحی از جزء اخالل استوکاستیک است که در معادالت همزمان نقض می‌شود. • در این حالت از روش‌های زیر استفاده می‌شود: – – – – روش حداقل مربعات دو مرحله ()2SLS روش حداقل مربعات سه‌مرحله‌ای ()3SLS روش حداقل مربعات سه مرحله‌ای تکراری ()I3SLS روش حداکثر راستنمایی • روش حداکثر راستنمایی با اطالعات محدود ()LIML • روش سیستمی حداکثر راستنمایی با اطالعات کامل ()FIML تحلیل مسیر در حوزة مطالعات اجتماع ي و اقتص ادي ،روشهاي تحليل چندمتغيرة زيادي وجود دارند كه به بررسي اثرات و روابط بين متغيرهاي مورد مطالعه مي‌پردازند. اي ن روشه ا عمدتاً اثرات مس تقيم ي ك متغير بر متغير ديگ ر را مورد بررس ي قرار مي‌دهد. ام ا در اي ن ميان تحليل مس ير از جمل ه تكنيكهاي چندمتغيره اس ت ك ه عالوه بر بررس ي اثرات مس تقيم متغيرهاي مس تقل بر متغير وابس ته ،اثرات غيرمس تقيم اي ن متغيره ا را نيز مدنظ ر قرار مي‌ده د و رواب ط بين متغيره ا را مطاب ق ب ا واقعيتهاي موجود در تحليل وارد مي‌كن د و ب ا بيان منطق ي ،رواب ط و همبس تگي مشاهده‌شدة بين آنها را تفسير مي‌كند. خاستگاه تحلیل مسیر • توسط Sewell Wrightتوسعه یافت. ‏Formulated in series of papers published in 1918, 1921, 1934, 1960 • برای استخراج اثرات مستقیم و غیرمستقیم در بین متغیرها ایجاد شد. • تحلیل مسیر با ارتباطات تبعی در بین متغیرها سرو کار دارد. • اصل اساسی موردنظر در تحلیل مسیر این است که هر ضریب همبستگی بین دو متغیر را می‌توان به مجموعه‌ای از مسیرها تجزیه کرد. • استفاده از تکنیک تحلیل مسیر مستلزم قبول پیش‌فرضی است مبنی بر اینکه روابط بین متغیرهایی که حداقل در مقیاس شبه‌فاصله‌ای هستند به طور خطی با افزایش متغیرها اضافه می‌گردد .هر متغیر وابسته بر اساس اثرات متغیرهای قبلی در دیاگرام مسیر و متغیر باقیمانده مورد تحلیل و تبیین قرار می‌گیرد. تجزیة همبستگی • همبستگی = اثرات مستقیم +اثرات غیرمستقیم براي سNاختن يNك مدل در بحNث تحليNل مسNير ،ده شرط مطرح شده اسNت كهبNه كمNك آنهNا، امكان تجزيNه و تحليNل ع ّلNي فراهNم مي‌گردد .درده شرط موردبحNث ،هفNت شرط اول مدل تئوريكي مناسبي را براي تجزيه و تحليل و استنتاج علّي فراهم مي‌سازد: .1بيان رسمي تئوري در قالب مدل ساختاري .2وجود منطق تئوريكي براي فرضيه‌هاي علّي .3معين‌نمودن نظم علّي .4مشخص‌نمودن جهت روابط علّي .5نوشتن معادالت توابع .6مشخص‌نمودن مرزهاي مدل .7ثبات مدل ساختاري .8عملياتي‌كردن متغيرها .9تأييد تجربي معادالت كاركردي .10برازش مدل ساختاري با داده‌هاي تجربي Nي ‏Nت براي عين ‏Nا الزم اس ‏Nن متغيره ‏Nي بي ‏Nت و معلول ‏Nط عل ‏Nي رواب ‏Nه منظور بررس ‏Nيري ب ‏Nل مس درتحلي شدن آنهNا و جلوگيري ازبروز اشتباهات ،ازنمودارهاي مسNيري اسNتفاده ‌نمودكه ايNن كار را ‏Nان داد: مي‌توان طي مراحل زيرنش الف -تعيين متغيرها :پيش از هرچيز بايد هريك از متغيرهاي مورد بررسي ب ه لحاظ نقش ي ك ه در س يستم ايف ا مي‌نماين د ،مشخ ص شده باشند .ازاي ن نظر دو نوع متغير وجوددارد: متغيربرونزا :ب ه متغيرهاي ي از مجموع ة متغيرهاي مورد بررس ي اطالق مي‌گردد كه تحت‌تأثير ساير متغيرها قرار نداشته باشند. متغيرهاي‌درونزا :ب ه متغيرهاي ي ازمجموع ه متغيرهاي موردبررس ي اطالق مي‌گردد كه تحت‌تأثير يك يا چند متغير ديگر قرارداشته باشند. انواع مدل‌های مسیری در تحليل مسيري با دو نوع مدل سروكار داريم (آذر:)1380 ، -1مدلهاي بازگشتي :به مدلهايي گفته مي‌شود كه در بين هيچ يك از متغيرهاي مورد بررسي ،رابطة دوطرفه يا متقابل وجود نداشته باشد. -2مدلهاي‌غيربازگشتي :يعني مدلهايي كه درآنها رابطة بين برخي ازمتغيرها به صورت دوطرفه باشد. مدل‌های مسیری بازگشتی ارتباطات علی یکطرفه می‌باشند. مدل غیربازگشتی ارتباطات علی دوطرفه هستند معنی مدل‌های مسیری • فرض بر این است که مدل‌های مسیری نشاندهندة فرضیه‌های علّی می‌باشند. • یک مدل مسیری معنی‌دار به معنی علیت نمی‌باشد. – بلکه با استفاده از داده‌های تجربی از یک مدل برای آزمون علیت استفاده نمود. اثرات غیرمستقیم و مستقیم • دو راهی که یک متغیر پیش‌بینی‌کننده ممکن است بر یک منغیر واکنش تأثیر بگذارد. • اول یک اثر مستقیم متغیر xبر روی متغیر y ‏x1  y • دوم یک اثر غیرمستقیم متغیر xبر روی yاز طریق یک متغیر پیش‌بینی‌کنندة دیگر. نمودار مسیر درونداد در مطالعة رضایت شغلی • بنابر آنچ ه گفت ه ش د ،پیکانه ا نشاندهندۀ پیوندهای عل ی مورد انتظار بی ن متغیرهاس ت این مدل از چپ به راست حرکت می‌کند تا از حجیت علی متغیرهائی را که به چپ نزدیکت ر هس تند را منعکس س ازد ،ه ر معرف نماد یک مس یر عل ی و بنابراین یک ‌ ضریب مسیر است که باید محاسبه شود. • بر پایه این مدل مالحظه می‌کنیم که: – – – – سن بر رضایت شغلی هم اثر مستقیم ( ) P1و هم اثر غیرمستقیم دارد. س ن ب ه گون ه مس تقیم بر درآم د اث ر می‌گذارد ( )P5که ب ه نوب ه خود در رضایت اث ر دارد ( )P6و بر خودفرمانی نیز اثر می‌گذارد ( )P2که خود بر درآمد اثر مستقیم دارد ()P4 و به نوبه خود رضایت را زیر نفوذ قرار می‌دهد (.)P6 عالوه بر این ،خودفرمان ی نی ز بر رضایت شغل ی ه م اث ر مس تقیم ( ،)P3ه م از طریق تأثی ر بر درآمد ( )P4بر آن اثر غیرمستقیم دارد ()P6 سرانجام ،درآمد بر رضایت اثر مستقیم دارد ( )P6اما بر آن اثر غیرمستقیم ندارد. • مشاهده می‌شود که درآمد ،خودفرمانی و رضایت شغلی دارای پیکانهای دیگری‌اند که مبدأ آنها خارج از حیطه آن متغیرهاست که مستقیم به آنها وصل شده‌اند این پیکانها معرف واریانس تبیین نشده برای هر متغیر میباشند ‌ بنابراین پیکان e1به خودفرمانی ( )P7بیانگر مقدار واریان س خودفرمان ی اس ت که از س وی س ن ،تبیین نمیشود. ‌ پیکان e2به رضایت شغلی ( )P8معرف مقداری از خطای ناش ی از رضایت شغل ی اس ت که از س وی س ن، خودفرمانی و درآمد توجیه نمی‌شود. س رانجام پیکان e3ب ه درآم د ( )P9معرف مقداری از واریانس درآمد است که از سوی سن و خودفرمانی تبیین نشده است. • این س ه جمل ۀ خط ا نشاندهندۀ این واقعی ت اس ت که متغیرهای دیگری وجود دارن د که بر خودفرمان ی و درآم د و رضایت شغل ی اث ر دارن د ام ا در این نمودار مسیر گنجانده نشده است. • • • • • تحلی ل مس یر اس اساً ب ا برآورد مقدار اتص االت بی ن متغیره ا و کاربرد این برآورده ا ب ه منظور بدس ت آوردن اطالعاتی دربارۀ فرایندهای علی زیربنائی سروکار دارد، • هرچن د این برآورده ا را می‌توان از طریق روشهای گوناگون ی بدس ت آورد ام ا س اده‌ترین راه برای محاسبۀ آنها ،کاربرد روش رگرسیون معمولی است • بهویژ ه این مفروض ه که متغی ر پس ‌ماند در معادل ۀ مفروضههای رگرس یون ‌ ‌ مشروط بر آ ن که ساختاری با متغیرهای تبیین‌کننده در آن معادله ناهمبسته است برقرار باشد • برای بدس ت‌آوردن برآوردهای ضرائ ب اص لی مس یر کاف ی اس ت ه ر متغی ر وابس ته (درونزا) ب ه متغیرهائ ی که مس تقیماً تح ت تأثی ر آ ن اس ت بازگش ت داده شود .ب ه بیان دیگ ر برای برآوردهای ه ر یک از مسیرهای مشخص شده ،ضرائب استانداردشده رگرسیون (یا ضرائب مسیر) محاسبه می‌شود. معادلههائی که ساختار روابط مفروض در ‌ معادلههای ساختاری یعنی ‌ این ضرائب از طریق برقراری یک مدل را مشخص می‌سازد به دست می‌آیند. • بدین ترتیب ،برای نمودار مس یر شکل الزم اس ت س ه معادل ه س اختاری ،یکی برای خودفرمان ی ،یکی برای رضایت شغل ی و یکی برای درآم د (ه ر یک ب ه عنوان متغیر وابسته و متغیرهائی که در معادله آمده به عنوان متغیر وابسته) محاسبه شود. ( + e1س )ن = x1خودفرمانی .1 .2 ی ( + x2س )ن = x1رضایتش غلی ( + e2درآمد) ( + x3خودفرمان ) .3 ی ( + x2س )ن = x1درآمد ( + e3خودفرمان ) بدین ترتیب ،برای نمودار مسیر شکل الزم است سه معادله ساختاری ،یکی برای خودفرمانی ،یکی برای رضایت شغلی و یکی برای درآمد (هر یک به عنوان متغیر وابسته و متغیرهائی که در معادله آمده به عنوان متغیر وابسته) محاسبه شود. ( + e1س )ن = x1خودفرمانی .1 ی ( + x2س )ن = x1رضایتش غلی ( + e2درآمد) ( + x3خودفرمان ) .2 ی ( + x2س )ن = x1درآمد ( + e3خودفرمان ) .3 ضریب اس تاندارد برای س ن در معادله ( )1مقدار :2Pضرائب سن ،خودفرمانی و درآم د در معادله ( )2به ترتی ب مقادیر 1P ، 2Pو 3P؛ و س رانجام ضرائ ب س ن و خودفرمان ی در معادل ه ( )3ب ه ترتی ب مقادیر 5Pو 4Pرا به دست می دهد .بنابراین به منظور محاسبه ضرایب مسیر ،ضرورت دارد سه معادله را به عنوان معادله‌های رگرسیون چندمتغیری در نظر بگیریم و ضرائب حاصل از آنها ضرائب مسیر را به‌دست می‌دهد. • .از مقادیر عرض از مبدأ در ه ر مورد ص رفنظر و س ه جمل ه خطا از طریق ریشه دوم 1 R2محاسبه می‌شود. • باید توجه داشت که چون به منظور تکمیل مسیرها الزم است هم ه ضرائ ب مس یر محاس به شود بنابراین نباید از روش رگرسیون گام به گام استفاده شود. • چون ضرایب مسیر ضرایب استاندارد هستند ،این امکان وجود دارد که آنها را به گونة مستقیم با هم مقایسه کنیم. می‌توان دید که س ن اث ر مس تقیم اما بس یار کوچ ک و منف ی در رضایت شغلی دارد در حالیکه اث ر غیرمستقیم آن مثبت و قابل توجه است. • بسیاری از پژوهشگران مایلند اثر کلی یک متغیر را بر متغیر دیگر محاسبه کنند برای مثال اثر کلی سن بر رضایت شغلی از طریق جمع اثر مستقیم ( )- 08/0با مجموع آثار غیرمستقیم آن به دست می‌آيد .آثار غیرمستقیم از طریق حاصلضرب ضرائب هر مسیر سن به رضایت شغلی به طریق زیر محاسبه می‌شود: • • • برای مسیرهای سن به درآمد به رضایت شغلی )57/0× 47/0( = 27/0 برای مسیرهای سن به خودفرمانی به رضایت شغلی )28/0 × 58/0( = 16/0 برای مسیرهای سن به خودفرمانی به درآمد به رضایت شعلی )28/0 × 22/0× 47/0( = 03/0 • بنابراین جمع آثار عیرمستقیم سن بر رضایت شغلی 27/0 + 16/0 + 03/0 = 46/0می‌باشد. • و برای اثر کلی سن بر رضایت شغلی باید اثر مستقیم آن را با کل آثار غیرمستقیم آن جمع کنیم که حاصل آن برابر با – 08/0 + 46/0 = 38/0خواهد بود. • این تمرین نشان داد که اثر غیرمستقیم سن بر رضایت هماهنگ با اثر مستقیم آن نیست زیرا اثر مستقیم آن نزدیک به صفر و اثر غیرمستقیم آن مثبت است. • نمیتوان تعیین کرد .برای مثال ،چنان که برخی اوقات ،جهت علی بین همه متغیرها را در نمودار مسیر ‌ میشود خودفرمان ی و ماهیت کار همبس ته‌اند ،یعن ی بین آنه ا ارجحیت عل ی یکی بر در شکل مشاهده ‌ دیگری وجود ندارد ،و اتص ال بین آنه ا ب ه وس یله یک پیکان دوس ره نشان داده شده اس ت .ه ر متغیر دارای یک اثر مستقیم ( P5و ،)P4و یک اثر غیرمستقیم بر غیبت از طریق رضایت شغلی است: خودفرمانی به رضایت ()P1 • و رضایت به غیبت ()P3؛ ماهیت کار به رضایت ( )P2و رضایت به غیبت ( .)P3ب ه منظور محاسبه ضرایب الزم ،نیاز به ضریب ‌ rپیرسون برای خودفرمانی و ماهیت کار و نیز نیاز به ضرایب استانداردشده دو معادله زیر داریم: ی =x1 + aرضایت ( + e1ماهیتکار) ( + x2خودفرمان ) ی = x1غ یبت (رضایت( + x3ماهیتکار) ( + x2خودفرمان ) ) + e2 • پ س از آ ن می‌توانیم کل آثار عل ی را ه م برای متغیرهای خودفرمان ی و ماهیت کار ،و هم برای رضایت محاسبه و با هم مقایسه کنیم .اثر کلی م­ی تواند از جمع اثر مستقیم با کل آثار غیرمستقیم تشکیل شود .اثر کلی این سه متغیر بر غیبت عبارت است از: • ( = )p5 ( + )p1 ()p3اثر کلی خودفرمانی • ( = )p4 ( + )p2 ()p3اثر کلی ماهیت کار • =p3اثر کلی رضایت شغلی مدل غیربازگشتی • تفسیر ارتباطات – X1ب ازگشتیو ع لیوابسته ب ه x4م ‌بی اشد است ه ط ور غ یرم ستقیم از ط ریق x4ب ه 4وابسته ب اشد – X1م مکن ب است ه ط ور غ یرم ستقیم از ط ریق x1ب ه 1وابسته ب اشد – X4م مکن ب است ه 4وابسته ب اشد. 1 م مکن ب • اگر این وضعیت وجود داشته باشد ... – فروض OLSنقض می‌شوند .در رگرسیون به روش OLSفرض بر ایت است که ارتباطات یکطرفه بوده و جمالت خطا از یکدیگر مستقل می‌باشند. در اینحالت باید از روش 2SLSیا روش حداقل مربعات دومرحله‌ای استفاده نمود. تحلیل عاملی Factor Analysis تحليل عاملي از تعدادی فنون آماری ترکیب شده و هدف آن ساده تر کردن مجموعه‌های پیچیدة داده‌هاست تعریف ماتریس همبستگی • ماتریس همبستگی مجموعه‌ای از ضرایب همبستگی بین تعدادی از متغیرها است: .1 .2 .3 .4 فرض بر این است که هر متغیر با خودش همبس تگی کام ل دارد(عناص ری که در قطرهای ماتریس همبستگی قرار می‌گیرند در فه م و تفس یر تحلیل‌های عامل ی مهم هستند). زواید زیادی در ماتریس وجود دارد ،بدین معن ا که ه ر ضریب دوبار در ماتریس ظاهر می‌شود. تحلیل عامل ی برای س اده‌کردن چنین ماتریس‌هایی طراحی شده است در یک ماتریس بزرگ از همبستگی‌ها، منطقی است بپرسیم که چه چیزی ممکن است این همبستگی‌ها را تبیین کند. • تعریف عامل :اساس ًا عامل ،بعد یا سازه‌ای است که روابط بین مجموعه‌ای متغیرها را به صورت خالصه مطرح می‌کند بنا به عقیدة رویس ( ،)1963عامل، ال از روی (یا بوسیلة) بارهای سازه‌ای است که عم ً عاملی‌اش تعریف می‌شود. • تعریف بارهای عاملی :همبستگی یک متغیر با یک عامل را بار عاملی گویند .فرض کنید کجموعه‌ای از آزمون‌های توانایی و پیشرف ت تحص یلی را تحلیل عاملی کرده‌ایم .این مثال ،سه عامل را در یک نوع تحلیل عامل ی از تواناییها نشان می‌دهد .عاملهای دیگری نیز ممکن است وجود داشته باشد اما اینها ماهیت عوام ل و بارهای عامل ی را بهت ر توضیح می‌دهند. متغیر عامل1 عامل2 عامل3 هوش 82/0 63/0 44/0 هوشبهر غیرشفاهی 78/0 35/0 51/0 لغات 68/0 64/0 21/0 ... ... ... ... ... ... ... ... تاریخ 32/0 68/0 17/0 مهندسی 25/0 43/0 12/0 فرانسه 49/0 09/0 60/0 فایده تحلیل عاملی • ب ه رغ م اینکه می‌دانیم تحلیل عامل ی برای خالص ه‌کردن ماتریس‌های همبستگی به کار برده می‌شود ،هنوز یک سؤال مهم باقی است و آن این است که با تحلیل عاملی چه کارهایی را می‌توان انجام داد و این فن چگونه می‌تواند سودمند واقع گردد؟ • برای پاسخ به این پرسش ،باید به این نکته توجه کرد که هنگام کاربرد این روش باید بین تحلیل اکتشافی ( )exploratoryو تأییدی ( )confirmatoryتمایز قائل شد. تحلیل عاملی اکتشافی :یک مثال • • هدف از تحلیل عاملی اکتشافی ،بررسی یک حوزه ( )fieldبرای کشف ابعاد یا سازه‌های اصلی آن حوزه است .به همین علت بود که اسپیرمن ( )1904تحلیل عاملی را در حوزه تواناییهای انسان بوجود آورد .او سعی کرد به این سؤال که چرا بین تواناییهای انسان همیشه همبستگی مثبتی وجود دارد پاسخ دهد( .در تحلیل عاملی توانایی‌ها ،این موضوع صورتبندی مثبت نامیده می‌شود بدین معنا که تمام همبستگی‌های ماتریس همبستگی ،مثبت است). به طور کلی در تحلیل عاملی اکتشافی ،قاعده بر این است که محققان تا حدامکان متغیرهای بسیاری را وارد تحلیل کنند تا ببینند کدام یک از آنها روی عامل موردنظر بار عاملی دارند تحلیل عاملی تأییدی • در ابتدا تحلیل عاملی صرف ًا یک روش آماری اکتشافی بود اما اخیرا ً این امکان بوجود آمده که با استفاده از تحلیل عاملی ،فرض‌آزمایی کرد .این روش که بوسیلة یورس کوگ ( )1973ابداع شده ،تحلیل تأییدی نامیده می‌شود. اشکاالت وارده بر تحلیل عاملی .1ایراد اصلی وارد بر تحلیل عاملی این است که بینهایت راه حل ریاضی معادل وجود دارد. .2تحلیل‌گران عاملی غالب ًا در تعیین مهمترین عالمت‌های یک حوزه با هم اختالف دارند. .3تکرار تحلیل‌های عاملی دشوار است. انجام تحلیل عاملی • يك ي از آماره‌هاي ي ك ه محق ق از طري ق آ ن قادر ب ه تعيي ن و تشخيص مناس ب‌بودن داده‌ها براي تحليل عاملي مي‌باشد ،آزمون KMOمي‌باشد كه مقدار آن همواره بين 0و 1درنوسان است. درصورتيكه مقدار KMOكمتر از 5/0باشد ،داده‌ها براي تحليل عاملي مناسب نخواهند بود .اگرمقدار آن بين 5/0تا 69/0باشد، مي‌توان ب ا احتياط بيشتري ب ه تحلي ل عامل ي پرداخت .ام ا درص ورتيكه مقدار آ ن بزرگت ر از 7/0باش د ،همبس تگي‌هاي موجود در بين داده‌ها براي تحليل‌عاملي مناسب خواهند بود. • Kaiser-Meyer-Olkin دررابطه با حجم نمونه نيز بايد تأكيد كرد كه تعداد نمونه نبايد كمتر از 50 مورد باشد و ترجيح ًا حجم نمونه را بايد به بيش از 100مورد افزايش داد. اولي ن تص ميم در بكارگيري تحلي ل عامل ي ،محاس بة ماتري س همبس تگي است .براي اينكار بايد مشخص شود كه آيا هدف ،محاسبة همبستگي بين متغيرهاست يا بين پاسخگويان ،اگر هدف مطالعه ،تلخيص متغيرها باشد. در اين صورت بايد همبستگي بين متغيرها محاسبه شود .اين روش يكي از تكنيكهاي عمومي و پركاربرد در مطالعات مي‌باشد كه به تحليل عاملي نوع Rمعروف است. • در تحليل عاملي مدلهاي مختلفي وجود دارد • كه از ميان آنها دو روش – تحليل مؤلفه‌هاي اصلي – و تحليل عاملي مشترك • از پركاربردترين اين روشهاست. • مدل تحليل مؤلفه‌هاي اص لي زمان ي مورد اس تفاده قرار مي‌گيرد؛ ك ه هدف محق ق تلخيص متغيره ا و دس تيابي ب ه تعداد محدودي عام ل براي اهداف پيش‌بيني باشد.

62,000 تومان