صفحه 1:
صفحه 2:
صفحه 3:
امروزه شامل مقاهیم و روشهلئی است که دررتمام پژوهشهلیی که مستلزم
جمع أورى دادهها.به وسيلة .يك قرا يند أزمليش و مشاهده و انجام استنباط و نتيجه كيرى.به وسيلة تجزيه و تحليل
این دادهها هستند. اهمیت بسیار دارند.
آمار هدر و علم جمع آوری: تعبیر و تجزیه و تحلیل دادهها و استخراج تعمیمهای منطقی در مورد پدیدههای تحت
بررصى است.
معادل كلمة آمار در زبان انكليسى 5886151365 است كه از لحاظ تاريخى: از كلمة لاتين 5181115
شده وايكى از معانى كلمة اخيره دولت است.
در طول چندین دهه» آمار فقط با بيان اطلاعات و مقادير عددى دربارة اقتصادء جمعيت شناسى و اوضاع سياسى
حاکم در یک کشوره سر و کار داشت.
حتی امروزه بسیاری از نشریات و گزارشهاي دولتی که تودهای از آمار و ارقام را در بردارند و تحت عناوینی از
قییل « آمار تولید مزارع» و «آمار کار گران» منتشر میشوند. معنی اولية کلمة آمار را در ذهن زندو می کنند.
اکثر افراد معمولی هنوز لین تصور غلط را دربارة آمار دارند که َن را منحصربه ستونهای عددی سرگیجه آور و
گاهی یک سری شکلهای مبهوت کننده میدانند.
بنابرلين: یدآوری لین نکنه ضروری است که نظریه و روشهای جدید آماری از حد ساختن جدولهای اعداد و
نمودارها بسیار فراتر رفتهاند. نمایشهای عددی به صورت جنبهای فرعی از آمار د رآمدهاند.
صفحه 4:
دیدگاههای زير را درمورد آمار بخوانید.
آبا علم آمار اینگونه است؟
دید گاههایی در مورد آمار:
* تهيه آمار کاری وقتگیر و زمان بر و اصولاً کسالت آور است.
* آمار گورستانی از اعداد و ارقام است که در هر اداره و سازمان نمونهای از آن پیدا میشود.
* آمار مجموعهای از روابط و فرمولهای ریاضی پیچیده و گیچ کننده است. ۱
oY, Y
1
از زر ی انب وا ۱ 3
۳ 5و
صفحه 5:
آمر ابزاری است که پسیاری با توسل به آن افکار عمومی را هنقع شود جلپ میکنند
آمار مفهومى است که پرای ثبت و تملیش اطلاعات عددیبه کار میرود. مان jy aa
گذشته» جمیت تواحی جتوب شهر aa alas Lg
برقدة مسابقة دو
اعى سمه عن زهان ميقن :به وسيل
صفحه 6:
مثالهائی از مطالعات آماری
مثالهای زییی نشاندهندة مواردی نوعی هستند که در آنها؛ فرایند کسب آگاهی در بررسی یک پدیده
شامل گردآوری و تجزیه و تحلیل دادههاست و آين خود مستلزم استفاده از روشهای آماری است.
پرورش گیاه :
* آزمایش پیوندزدن انواعی از گیاهان که از نظر ژنتیکی متفاوتند؛ به منظور تولید
كياهان پیوندی پر محصول مورد علاقَهٌ شدید متخصصان کشاورزی است. بهعنوان
بيك مثال ساده؛ فرض كنيد كه قرار است ميزان محصول دو نوع گیاه پیوندی تحت
آب و هوا و شرلیط اقلیمی مشخصبا هم مقايسه شوند. تنها راه كسب اطلاع از ميزان
بارورى لين دو نوع كياه نسبت بهیکدیگر عبارت است از پروراندن آنها در تعدادی
از کرتها؛ گرد آوردن دادهها دربار؛ میزان محصول آنها و سپس تجزیه و تحلیل
دادههای مزپور.
صفحه 7:
تشخیص بیماریها
* _ برای انجام موفقیت آمیز معالجة بسیاری از انواع سرطانبا عمل جراحیء
پرخوردار است و از اينرو لازم است که برای انجام معاینات پزشکی مرتباًبه پیمارستان مراجعه شود. چون مراجعة
مرتب به بیمارستان و انجام معاینات پزشکی گران و مشکل است. پزشکان در جستجوی نوعی روش تشخیص
مؤشر بيمارى هستند كه خود شخص بتواند آن را انجام دهد. برای ارزیابی قابلیت یک روش جدید تشخیص
» روش
پیماری برحسب درصد موفتیت آنن در تشخیص درست موارد پیماری و اجتتاب از تشخیصهای ۱
موردنظر بايد روى افراد زیادی آزمایش شود و نتیجه با معاینات پیمارستانی مقایسه شود.
برنامههای تربیتی و آموزشی
برنامای تربیعی و آموزشی که برای انواع متقاضیان (از قییل دانشجویان دانشگاه: کار گران کارخانه؛ گروههای
اقليت: افراد تاقصالعضو كودكان عقبافتاده) در بسيارى از زميتدها طرح مى شوند: دائماً مورد بررسی» ارزیلبی و
اصلاح قرار میگیرند تا سودهندی آنها برای جامعه افزلیش یابد. برای کسب اطلاع از کارلئی برنمههای مختلف
در مقایسه با یکدیگر, ضرورت دارد که دادههلئی دربارة موفقیتهایا رشد مهارت افرادی که برنلمه در مورد آنها
oS ole! گردآوری شود.
صفحه 8:
تحفیقات اجتماعی-اقتصادی:
در بسیایی از قلمروهای جامعهشناسی؛ اقتصاد. علوم سیاسی, مطالعمانی در زمینههای مربوط به رفاهاقتصادی گروههای قومی گوناگون. هزینههای
مصرف کنندگان در سطوح مختلف درآمد و نظرات گوناگون در هنگام وضع یک قانون و منههایینظیر اينها اتجام مىككيرد. این مات
نوعاً بر مبناى دادههابى اتجام مى كيرند كه از راه مصاحبه يا تماس با تمونداى از فرادبهدست می آیند: که این نموته به وسیلة روشهای آماری
از كل جامعداى كه قلمرو مطالمه را تشكيل مىدهدء انتغاب فى شوند. سيس اين داددها مورد تجزيه و تحليل قرار مىكيرند و تغييراتى از
موضوع مورد نظر به عمل مى آيد.
باذاديالىة
با كسترش صنايع ملف و بحث بازار رقابتى در قرن بيست و يك بسيايى از صنابع به بال يافن روش هائى در شناسائى بازار و خواستههاى مشترى.
رى با آنها در ازتباط ست
به طریق علمی كرديدهاتد. تتايج حاصل همواره با استفاده از مطالعات آمارى روى مشتريان و بها مراكزى كه
صورت مى يذيرد. بدعنوان مثال يك شركت توليدكنندة بودر لباسشوثى بس از تحفيق ديبارة ميزان فروش فروشكادهاى يك منطقفه سهم
فروش بودر ... را درمى يابد. بس از اعمال تبليغات جديد وو به فاصلة زمانى مناسب این کار مجددا صورت گرفته و سهم افزایش فروش بررسی
مىكردد. ويا در همين مقوله براى كسب اطلاع ان ايدكه در توليد مايع ظرفشوئى آيا از لحاظ مصرف كنندكان: بوى اسانس ليمو جا توت فرنكى
فاوتی وجود دارد. از ۴۰۰ نفر مصاحبهمیشود که ۱۲۵ تفربوى اسانس ليمو و بقيه توت فرنكى را ترجيح فى دهند.
كنترل كيفيت:
.ببشرفتهاى آمارى در بخمش صنايع بيشتر مربوط به مسائل كنترل كيفى است. استفاده از مفهوم آزمون فرضیهای آماری در بحث کنترل حین تولید.
محصولات توليدى: استفاده از روشهای نمونه گیری جهت پذیرش برای شناسائی محصول مطلبق دیخواست با استفاده از یک نموته از محصول
ole بایرسی صددرصد و استفاده از ابزارهای ساده آمایی در کنترل فرآیند آماری ([6091۳0) (Statistical Process
ماد هیستوگرام:نمدار پر کنش: تمودارمیلای و استفاده از بحث طراحی آزمایشهای مناسب و جمع آوری اطلاعات و بسیاری روشهای
آماری که به صور مختلف مورذ استفادة واقع pg از تلاش مسئولین کیفی صنایع ره خود اختصاص دادهاست.
صفحه 9:
آمارشناسها چه میکنند؟
جهان به سوی کمی شدن اطلاعات پیش می رود. در بسیاری از حرفهها و شغلهاء تصمیم گیریها به اندازه گیریهای
عددی و داده بستگی دارند. داده ها تنها شامل اعداد نیستند؛ بلکه اعداد خود حامل اطلاعاتی در مورد یک سیستم
مشخص هستند و احتیا
دارند که در سیستم مربوطه تفسیر شوند. با توجه به این رشد در استفاده از دادههه نیاز و
تقاضا برای وجود آمارشناسهایی که در زمینههای زیر کارشناس باشند؛ احساس می شود:
ارائه و تولید دادههای قابل اعتماد
تجزیه و تحلیل دادهها به منظور روشن و واضح ساختن معنای آنها
ارائه استتاجهای عملی از دادهها
آمارشناسها از تواناییهای کمّی؛ علم آمار و مهارتهای رولبط عمومی و برقراری ارتباط برای حل بسیاری از مشکلات
و مسایل موجود در جامعه استفاده میکنند. آمارشناسها در تعیین روشهای نمونه گیری و جمعآوری دادههاه
نظارت بر اجرای مطالعه. پردازش دادهها و نظر دادن در مورد ننایج مطالعات بدستآمده کمک میکنند.
صفحه 10:
فعالیت آمارشناسها در زمینه مطالعه و بررسی نمونهای
فعالیت آمارشناسها در مراکز دولتی برخی زمینههای فعالیت برای آماریها در
مراکز دولتی
فعالیت آمارشناسها در زمینه پژوهشهای علمی
فعالیت آمارشناسها در زمینه صنعت و تجارت
برخی زمینههای فعالیت برای آماریها در صنعت و تجارت
فعالیت آمارشناس ها در زمینه بهداشت» پزشکی و سلامت
صفحه 11:
مشخصههای شغلی آمارشناسها
استفاده از دادهها برای حل مشکلات و مسایل
استفاده از دانش ریاضی و آمار خود در حل مشکلات اجتماعی: اقتصادی؛ پزشکی»
زیست محیطی؛ سیاسی و ...
کار کردن هم به صورت انفرادی و هم به صورت عضوی از یک گروه
استفاده از علم ار تباطات در برقراری رابطه با متخصصین علوم دیگر و مشورت با
آنها و ادامه دادن مستمر فعالیتهای آموزشی
گسترش مرزها و قلمرو آمار و احتمال از طریق آموزش و تحقیق
صفحه 12:
سواد آماری جیست؟
سواد آماری یک توانابی اقابلیت است:
۰ توانیی فکر کردن منتقدانه درمورد استدلالها با به كار بردن آمار به عنوان سند يا مدرك
قابليت خواندن و تفسير داددهاء قابليت فهم آنجه كه خوانده میشود.
* 0 توانابى فهم و تفسير آمارهابى كه هر فرد در زندكى روزمره با آنها سروكار دارد.
* توانابى استفاده صحيح از آمار توسط هم افراد جامعه
سواد آماری؛ بر تصعیمگیریها با استفده از آماربهعنوان سند و مدرک متمر کز شده است. همانگوته که سوادخواندن و نوشتن بر
استفاده از كلمات به عنوان مدرك متمر كز شده استء
سواد آماری بیشتر درمورد سژالات است قا جراب ها. سوادآماری eee زيادى ندارد. اما مى تولند كمك کند تا سژالات بهتری
پرسش شود و در نتبجه تصممها و قضاوتهای بپتری صورت گیرد.
سواد آماری یک هنر است. هنر تصمیم گرفتن و قضاوت کردن تحت شرایط نامطمئن.
صفحه 13:
با سواد آماری کیست؟
۰ با سواد آماری کسی است که قادر باشد تفاوت پین رابطه معمول و رابطه علت و
معلولی را از یکدیگر تشخیص دهد.
* او کسی است که وقتی با جملاتی همانند جملات زیر روبرو میشود: درست پا غلط
بودن جمله دوم را مدرکی مستند برای درست يا غلط بودن جمله سوم نداند:
جمله اول: افرادی که وزن بیشتری دارند بلندقدتر از افرادی هستند که وزن کمتری دارند.
جمله دوم: وزن یک رابطه مثبت با قد دارد.
جمله سوم: اگر شما وزن بیشتری بدست آوریده انتظار میرود که قدتان نیز بلددتر شود.
* واضح است که برای بزرگسالان جمله سوم غلط است. اما نمیتوان نتیجه گرفت که
اگر جمله سوم غلط باشد آنگاه جمله دوم نیز غلط خواهد بود. درستی جمله دوم
مدرکی است برای درستی جمله سوم اما درستی جمله دوم برای اثبات درستی جمله
سوم کافی نیست.
صفحه 14:
با سواد آماری کیست؟ (ادامه)
با سواد آماری کسی است که قادر باشد تفاوت بین عبارت "نسبت دادنی" را از عبارت "نسیت داده شده"
تشخیص دهد
مثال ۰٩درصد خود کشی ها را افراد متاهل مرتکب می شوند. اين آمار به افراد مناهل نسبت داده شده است: اما
این بدین معنانیست که اگر افراد ازدواج نکنند این نسبت کاهش خواهد یافت.
با سواد آماری کسی است که فرق آماری که بر اساس نمونه به دست آمده را از پارامتر جمعیت تشخیص دهد.
باسواد آماری کسی است که بتواند برداشت درستی از درصدهاه میزان ها و نرخ ها داشته باشد
مثال: درصد رانندهها در میان زنان همانند درصد راننده هایی که زن هستند: نیست. درصد بیمارانی که نتیجه
آزمایش آنها در مورد نوعی بیماری مثبت است همانند درصد افرادی که نتیجه آزمایش مثبت دارند و بیمار
صفحه 15:
شیوههای جمعآوری اطلاعات
صفحه 16:
تعرية 5
بعر حد امكان به
صورت ویژه
صفحه 17:
کدگذاری برای دادههای els یعنی تعیین
عدد برای هر طبقه یا دسته.
زن ۱
مرد ۲
صفحه 18:
مشخص کردن روش واحدهای اندازهگیری
8 وزن شما چقدر است؟ (برحسب کیلوگرم. پوند. گرم)
* دیشب چند ساعت تلویزیون تماشا کردید؟ (ساعت., دقیقه)
صفحه 19:
نوشتن سوّالات بدون اریب
* با اریب: آیا شما موافقید که افزايش مصرف کود باعث
کاهش عملکرد میشود؟
* بدون اریب: نظر شما در مورد مصرف کود بر عملکرد
صفحه 20:
سژّالات خود را در یک مطالعةً بيلوت قبل
از انجام مطالعٌ اصلی امتحان نمایید
* (۸ تا ۱۰ مورد یا واحد از افراد. دانشآموزان, درختان و ..)
صفحه 21:
انواع دادهها
صفحه 22:
انواع دادهها
* دادههای قیاسی دادههای معیاری
Visualizing
2
oe
لا
a
8
8
Data
صفحه 23:
دادههای قباسی
* موضوعات و صفات مورد بررسی يه طبقاتی بر اساس بعضی
از صفات کیفی گروهبندی میشوند.
صفحه 24:
مثال: دادههای قباسی
° رنگ مو
- بلوندء قهوهای قرمزء سياه؛ غیره
* نظر دانشجويان در مورد نحوةٌ تدريس
ناراحت» خنثی» خوشحال
* وضعیت سیگار کشیدن
- سیگاری؛ غیرسیگاری
صفحه 25:
طبقهبندی دادههای قیاسی به صورت:
اسمی» ترتیبی و دوتایی
re od
صفحه 26:
دادههای اسمی
یک نوع از دادههای» قیاسی است که صفات در طبقههای
غیرمرتب قرار میگيرند.
Nominal Data
ei airport town mine capital
‘oint
x ۰ R *
tine tiver road boundary | pipeline
A orchard desert forest water
= سس | 39
صفحه 27:
مثال: دادههای اسمی
* رنگ مو
- بلوند» قهوهاى» مشکی» قرمز؛ غیره
نزاد
- هندی» افریقایی؛ آمریکایی؛ غيره
صفحه 28:
دادههای ترتیبی
نوعی از دادههای قیاسی میباشند که رتبدٌ آنها مهم استد
Ordinal Data
kp ote O81 wot! Populated
production Places
0 | و high ری
> rational هر
اوم ع5 Rae
Roads Drainage
ل و و
tine major stream
fecal erase
Area
صفحه 29:
منال: دادههای ترتبمی
خیلی کم. کم متوسط obj خيلى زياد
* شدت بیماری
* نظر دانشجویان دربارژ درس
صفحه 30:
دادههای دودویی
* شکلی از دادههای قیاسی که تنها دارای دو طبقه هستند.
* دادههای دودویی میتوانند یا اسمی یا ترتیبی باشند.
صفحه 31:
منال: دادههای دودویبی
* وضعیت سیگاری بودن
- سیگاری؛ غیرسیگاری
* حضور
— حاضر غایب
صفحه 32:
دادههای سنجشی
* اهداف مورد مطالعه بر اساس بعضی از صفات کمی قابل اندازه گیری میباشند.
دادهها به صورت اعداد میباشند.
صفحه 33:
مثال: دادههای سنجشی
سطح کلسترول
سن
ميزان عملكرد
تعداد دانشجویانی که در کلاس دیر حاضر میشوند.
* زمان لازم برای انجام تکالیف درسی در منزل
صفحه 34:
دادههای سنجشی تقسیم میشوند به
Oistrete pr Ovuiiturus
صفحه 35:
دادههای سنجشی كسسته
تنها مقادیر معینی را خواهند داشت
(شکافی بین مقادیر ممکن وجود دارد)
دادههای سنجشی پیوسته
از نظر تلوریک, هر مقداری
در درون یک فاصله را میتوان با ابزارهای اندازهگیری دقیق
محاسبه نمود.
صفحه 36:
دادههای گسسته - شکاف بین مقادیر ممکن
it 4 لیلبا
7 6
دادههای پیوسته - از نظر تئوریکی هیچ شکافی بین مقادیر ممکن وجود ندارد
1000
صفحه 37:
مثالها
دادههایی با معیارهای کسته
نمرات آمار
تعداد دانشجویانی که دير به کلاس میآیند
تعداد جرائمی که به مراکز پلیس گزارش شده است.
تعداد دفعاتی که از یک کلمه استفاده میشود.
عموماً دادههای گسته قابل شمارش هستند.
صفحه 38:
مثالها:
دادههای معباری iw gd
* سطح کلسترول
سن
* زمان لازم براي انجام تکالیف مدرسه
Le gas دادههای» پیوسته از اندازه گیری بدست میآیند
صفحه 39:
انواع دادههای جمعآوری شده
در یک مطالعه تعیین کنندة نوع م
تحلیل آماری مورد استفاده #
صفحه 40:
برای مثال ...
* دادههای قیاسی عموماً با استفاده از درصد (یا نسبتها) خلاصه
میشوند.
- ۱۱درصد دانشجویان دارای خالکوبی میباشند.
۳۹/۳۳/۲ و ۸۲۶ دانشجویان در کلاس به ترتیب جدیدالورود سال
دوم سال سوم و سال چهارم
صفحه 41:
و برای مثال ...
* دادههای معیاری به طور مثال با استفاده از متوسط یا میانگین)
خلاصه میشوند.
— متوسط وزن مردان در بین ۲۵۰ دانشجوی درس آمار در پاییز ۱۳۸۷
۳ پوند است
- متوسط وزن زنان در بین ۲۵۰ دانشجوی درس آمار در پاییز ۳۸۷
۸ پوند است
صفحه 42:
آمار توصیفی
توصیف دادهها با اعداد
معیارهایء مکانی
صفحه 43:
چه جیزی توصیف میشود؟
* مکان با مرکز دادهها چیست؟ (معیارهای. مکانی)
* دادهها چگونه تغییر می کنند؟ (معیارهای. تغییر پذیری)
صفحه 44:
* میانگین
* ميانه
معيارهاى مكانى
صفحه 45:
ميانكين
نام ديكر متوسط
اكر ميانكين يك جمعيت را توصيف كنيم با .لإ نمايش داده مى شود.
اگر مينگین نمونه را توصیف کنیم با یمد نمايش داده مى شود.
مناسب برای توصیف دادههای سنجشی
به ميزان زيادى تحت تأثير مقادیر غیرمعمول که «برونهشت» يا
طاح نام دارند» قرار مى كيرد.
صفحه 46:
محاسبة ميانكين ذمونه
xX
Xai :فرمول
X= فرمو
یعنی جمع تمام دادهها و تقسیم به تعداد آنها
صفحه 47:
ميانه
۰ و
نام دیگر برای صدک ۰ هام
* مناسب برای توصیف دادههای سنجشی
* مناسب برای دادههای برونهشت. یعنی تحت تا ثیر مقادیر
۲ 3 مب م2
غیرمعمول قرار نمی گیرد.
صفحه 48:
محاسبة ميان نمونه
مرتب کردن دادهها از کوچک به بزرگ
اگر تعداد دادهها فرد باشده میانه مقدار وسط میباشد.
دادهها: © 0 9 ۶ 04
دادههای مرتب شده: 0 8 9 6 6
ale
صفحه 49:
مرتب کردن دادهها از کوچک به بزرگ
اگر تعداد دادهها زوج باشده میانه متوسط دو مقدار وسطی است
دادهها : 9 4690 ©
6 0 6 9 9 0 me passe
میانه < (۵+)/0 <
صفحه 50:
مد
* مقاديرى كه بيشترين فراوانى را دارند.
* یک مجموعه داده مى تواند جندين مد داشته باشد
* برای تمام انواع داده مناسب است اما بیشتر برای دادههای
قیاسی یا دادههای. گسسته با تعداد اند کی از مقادیر ممکن مفید
است.
صفحه 51:
در بسرنامة:طده:)
Variable (On \(Mean ) (Median ۲۳۱۱6۵8 StDev SE Mean
Phone \a39 /\a21.6/ نت 88.1 217.7 18.5
oe 7 كت
Variable Minimum Maximum 01 03
Phone 2.0/ 2000.0) 30.0 120.0
| /
\
| /
ا تلعداد دادهها < ۱۲
ف /
ميانكين ذمونه
صفحه 52:
مناسبترین معیارهای مکانی بستگی
به شکل توزیع دادهها دارد
صفحه 53:
:مناسبترین معیارهای مکانی بستگی دارد به
ui دادهها متقارن هستند یا چوله
٠ آیا دادههای دارای یک مد هستند (۳8110001) با دارای
چند 1« (nultimodal)
صفحه 54:
خا
۵ مه مه جه مه ۱۵
CPs
سس
مه مه هه مه هه
a
د هه
ده
0
صفحه 55:
متقارن و یک نمایی
8
0
صفحه 56:
رن و یک نمایی
3.0766 1
Orsoriptue Gritotice
Variable N Mean Median
GPA 92 3.0698 3.1200
Variable Minimum Maximum
GPA 2.0200 3.9800
صفحه 57:
متقارن و دونمایی
Female
Male
1
56 66 76
Height (inches)
صفحه 58:
متقارن و دونمایی
Variable N Mean Median TrMean stDev
Males 84 70.048 70.000 70.092 3.030
Females 89 64.798 65.000 64.753 2.877
ALL 176 67.313 67.000 67.291 4.017
Variable SE Mean Min Max 01 03
Males 8.331 63.0 76.0 68.0 72.0
Females 0.305 56.0 77.0 63.0 67.0
ALL 0.303 56.0 77.0 64.0 70.0
صفحه 59:
متقارن و دونمایی
A هاي
height
صفحه 60:
جو له به ور است
عادس لك قاط رو قاط Dawber vPOusic OOs vPEpriag
a
40
Gequescy
ص ص ح
ده
1 1 1 1
© 0۳ aw au 0
ucober oP ما
صفحه 61:
au 0 مله ههه ©
ucober PROD:
صفحه 62:
Ovsorptve Gtatetis
Variable N Mean Median TrMean StDev SE Mean
CDs 92 61.04 46.50 52.93 62.90 6.56
Variable Minimum Maximum 01 03
CDs 0.00 400.00 21.50 83.00
صفحه 63:
جوله به جب
لد
GH a B aw مه 5 دك ضع ab ده
yrades:
ay
a
aw
ده
erect
صفحه 64:
جوله به جب
grades
صفحه 65:
جوله به جب
Variable N Mean Median TrMean StDev SE Mean
grades 22 89.18 93.50 90.60 12.92 2.76
Variable Minimum Maximum 01 03
grades 50.00 100.00 87.00 98.00
صفحه 66:
انتخاب معیار مناسب مکانی
* اگر دادهها متقارن باشند» میانگین» ميانه و مدء تقريباً برابر
* اگر دادههای دارای چند مد باشند» میانگین میانه و یا مد را
3 و } a
براه هر زيركروه كزارش دهيد.
* اگر دادهها چوله باشند» میانه را گزارش دهید.
صفحه 67:
آمارهای توصیفی
توصیف دادهها با اعداد
معيارهاى تغيير يذيرى
صفحه 68:
چه چیزی توصیف میشود؟
* مکان با مرکز دادهها چیست؟
* دادهها چگونه تغییر می کنند؟
صفحه 69:
معیارهای تغییرپذیری
دامنه
دامنة Soke ow
واربانس و انحراف معیار
تمام این معیارها تنها برای دادههای سنجشی مناسب هستند.
صفحه 70:
دامنه
Sf زز ۰
تفاوت بین بزرگترین و کوچکترین داده
* به میزان زیادی تحت تأٌثیر برونهشتها قرار میگیرد.
* برای دادههای متقارن بدون هیچ برونهشتی مناسب است.
صفحه 71:
دامنه جیست؟
CRBs oP Gpriay عاوعلیت )0 و639۱
ay
ص ده
هه مه مه جه مه هه مه مه عن مه نه
CRO
صفحه 72:
دامنه
Orsoriptue Gritotice
Variable N Mean Median TrMean StDev SE Mean
GPA 92 3.0698 3.1200 3.0766 0.4851 6
Variable ii azn 01 03
GPA ae 3.9800 2.6725 3.4675
< 5.09 - 9.90 = dale
99
صفحه 73:
دامنة بين چار کی
* تفاوت بین چارک سوم (درصد ۷۵م) و اولین چارک (درصد
۲۵م) يعنى نيمة وسطی دادهها
IQR = Q3-Q1 *
۰ برای مشاهدات برون هشت و کرانی کارا میباشد.
* برای دادههای چوله مناسب است.
صفحه 74:
diols بين چارکی چیست؟
عامعلی 306 166۱6۵ بسن 9۳۶)
6ه مه م
> هه هه مه هه جه مه هو
0
مه
40
ده
و و
صفحه 75:
دامنة بینچار کی
Orsoriptue Gritotice
Variable N Mean Median TrMean StDev SE Mean
GPA 92 3.0698 3.1200 3.0766 0.4851 0.0506
. لا
Variable Minimum Maximum 7 01 03
GPA 2.0200 3.9800
3 3.4675
IQR = 3.4675 - 2.6725 =
0.795
صفحه 76:
واربانس
Number of High School Friends
0
1
4
A
Mean = 4
۱. _ تفاوت بين هر داده با میانگین را بیابید.
2
ین تفاوتها رابه توان دو رسانده و با =
ا يا ادك
۳ _به یکی کمتر از تعداد دادهها تقسیم کنید. 1 n-
صفحه 77:
واربانس
اگر واریانس جمعیت را اندازه بگيريم آن را با 08 نشان
میدهیم.
اگر واریانس نمونه را اندازه بگیریم آن را با مج نشان
میدهیم.
متوسط مربع انحراف دادهها از میانگین خود را اندازه
2
میگیرد.
به ميزان زيادى تحت تأثير برونهشتها میباشد. برای
دادههای متقارن بهتر است.
واحدها درجةٌ دوم هستند.
صفحه 78:
انحراف معیار
انحراف معيار نمونه ريشة دوم واریانس نمونه میباشد و
بنابراین با < نشان داده میشود.
واحدهاء واحدهای اصلی هستند
انحراف متوسط دادهها از ميانگین خود را اندازه میگیرد.
همچنین به میزان زیادی تحت تا ثیر برونهشتها قرار دارد.
صفحه 79:
واربانس با انحراف معیار چیست؟
3
aap
Ove
ae if
id
و یه
4
مت م apd daw dao dav dap ako aap dap
Cpeed (MPH)
صفحه 80:
واریانس با انحراف معیار
Median rrttean /stoen\se Mean
90.00 90.83; 11.32) 1.01
110.00 105.62 | 27-39) 1.74
Ql 93
Maximum
120.00 85.00 98.25
162.00 95.00 118.75
N Mean
126 91.23
100 06.79
Minimum
65.00
75.00
Sex
female
male
female
male
Females: s = 11.32 mph and s? = 11.32?
= 128.1 mph?
Males: s = 17.39 mph and s? = 17.392 =
302.5 mph?
صفحه 81:
واربانس با انحراف معیار چیست؟
Qpeed مسا سا افععط
صفحه 82:
واریانس با انحراف معیار
Sex N Mean Median TrMean Fea SE Mean
female 126 152.05 150.00 151. 39| 18. 86 1.68
male 100 177.98 183.33 176.04 0 2.98
Sex Minimum Maximum 01
female 3 200.00 141.67 des 75
male 125.00 270.00 158.33 197.92
Females: s = 18.86 kph and s? = 18.86? =
355.7 kph?
Males: s = 28.98 kph and s? = 28.98? =
839.8 kph?
صفحه 83:
oe
ضریب تغییر
* نسبت انحراف معیار نمونه به میانگین نمونه ضربدر ۱۰۰
oe ۳ 1 5 ۰ 1 0 }
معیار تغییرپذیری نسبی؛ یعنی تغییرپذیری نسبت به بزرگی
دادهها
* بدون واحد است بنابراین برای مقايسة تفاوت بین دو گروه
خوب است.
صفحه 84:
oe ۰
صریب تعییر
Median TrMean 7 Mean
90.00 90.83; 11.32) 1.01
110.00 105. ow ۸ 1.74
Maximum
120.00 85. 4 98. 0
162.00 95.00 118.75
W/o)
126 91.2
100 eit
Minimum
65.00
75.00
Sex
female
male
female
male
Females: CV = (11.32/91.23) x 100 = 12.4
Males: CV = (17.39/106.79) x 100 = 16.3
صفحه 85:
oe ۰
Sex N / Mean Median TrMean / StDev\ SE Mean
female 126 /152.05) 150.00 151.39| 18.86) 1.68
male 100 we 183.33 176-08 \ 28-94) 2.90
03
Sex Minimum Maximum 1
female 108.33 200.00 141.67 163.75
male 125.00 270.00 158.33 197.92
Females: CV = (18.86/152.05) x 100 =
12.4
Males: CV = (28.98/177.98) x 100 = 16.3
صفحه 86:
مناسبترین معیار تغییرپذیری بستگی
دارد به ...
شکل توزیع دادهها
صفحه 87:
انتخاب معیار مناسب تغییر پذیری
* اگر دادهها متقارن باشند: بدون هیچ برونهشت جدی از دامنه
و انحراف معیار استفاده میشود.
* اگر دادهها چوله باشند» و يا دارایب برونهشت باشند از دامنة
بینچار کی استفاده می گردد.
* اگر در حال مقایسه تفاوت در بین دو مجموعه داده باشیم» از
ضریب تغییر استفاده می گردد.
صفحه 88:
احتمال
مجموعهای از قوانین احتمال
صفحه 89:
حادثه
dns * یک مشاهده یا آزمایش یا توصیف بعضی از پیامدهای
بالقوه
* با این حروف نشان داده میشوند. © see, BD,
صفحه 90:
احتمال
بین صفر و ۱ میباشد که نشاندهندة احتمال وقوع یک حادثه
است.
یک حادثه با احتمال صفر یک Bole بیاثر است.
یک حادثه با احتمال یک یک حادلة قطعی است.
نزدیکتر به یکء احتمال وقوع حادثه بیشتر است.
احتمال حادنةٌ ۸ را با (36 نشان میدهند.
صفحه 91:
مثالها از حادثة بوچ:
* یک پرنده انسان شود
* یک زن از سرطان پروستات بمیرد.
صفحه 92:
مثالهای از حادثههای قطعی
* خورشید امشب غروب خواهد کرد.
* نیمسال به پایان خواهد رسید.
٠ یک نفر خواهد مرد.
صفحه 93:
سه راه برای تعیین احتمالات
* روش فراوانی
* روش کلاسیک
* روش عقيدة شخصی
صفحه 94:
توزیع نرمال
و مقدمهای بر توابع پیوسته جكالى احتمال 2
صفحه 95:
48
هیستوگرام درصد
a
(Qiervals oP size GD
48 Co as
40
ap
av
ao
ده
امس
صفحه 96:
هیستوگرام
مساحت مستطیل - احتمال
a
(AQuenvals oP size جلك
owe 4
د سه
oan |
2 ate وه
6
Oeusity
صفحه 97:
... کاهش اندازهٌ فاصله
a
(Aitervals oP size ID
aa 4
د سه
aa
Se ص 6 B ap as as aD
a
Oeasity
صفحه 98:
کاهش بیشتر اندازة فاصلهها
0
(Aervals oP size Q
dad ad dar dad akD
a
ap
Ao
مه 42 مم
oa 4
ل هوس
ل انس
caw 4
مه
صفحه 99:
توابع بيوستة چگالی احتمال ...
* منحنی توصیف کنندةٌ احتمال هر محدودهای از مقادیر را کسب
مى كند. مثل:
P(X > 120), P(X<100), P(110 < K >
)120
* مساحت زیر منحنی - احتمال
کل مساحت زیر منحنی ۱
* احتمال بدست آوردن یک عدد خاص ۰ است. مثلاً
P(X=120) = 0
صفحه 100:
ع ویژهای از تیه چکالی احتمال پیوسته
p.d.
Q@ell-skuped curve
oa J
awe 4 ewe = ADEAD = €
ل مه
as 4
our 4
eos = AED = 40
cas 4
ل هوس
ل مه
caw 4
@ @ a ® @ a aw
صفحه 101:
خصوصیات توزیع نرمال
متقارن - منحنی زنگولهای
شکل منحنی بستگی به ميانگین جمعیت | و انحراف معیار 6
دارد.
مرکز توزیع | استد
وسعت منحنی بستگی به 0 دارد.
بیشتر مقادیر اطراف میانگین هستند اما بعضی از مقادیر
کوچکتر و بعضی بزرگتر میباشند.
صفحه 102:
مثالهابی از متغیرهای تصادفی نرمال
* عملکرد تولید کشاورزان در یک منطقه
صفحه 103:
احتمال بالای ۷۵ جقدر است؟
Pobubility studea sores kiyker than
ane ل
awe 4
ل اه
ows 4
بویت با ل مويه
150
as 4
مه
oa 4 7
ل همه
صفحه 104:
سطح زیر منحنی - احتمال
محاسبة جبری؟
شخصی این کار سخت را برای ما انجام داده است.
ما تنها به یک جدول احتمالات برای هر توزیع نرمالی نیاز
داریم.
اما تعداد بینهایت توزیع نرمال وجود دارد (برای هر میانگین و
انحراف معیاری یک توزیع)
جواب استاندارد کردن 51810018170126 میباشد.
صفحه 105:
استاندارد كردن ...
* مقدار « را از میانگین | کم نموده و به انحراف معيار تقسيم
کنید. نتیجه مقدار 2 میباشد. یعنی:
Z = (X- w/o
را نرماللستاندارد مینبامنده میانگین آن0 ۵ و لنحراف 7, *
معیارعبرلبر با ۱ دارد.
سپس از جدول احتمال برای 2 استفاده میشود. *
صفحه 106:
استفاده از حدول <
Qaadard Oerwal Ourve:
Pal probly
دح
ae
وه
ae 4
00 4
ao +
Qeusity
صفحه 107:
احتمال بين ۶۵ و ۷۰ جیست؟
ous 4
awe 4
ل ص۵0
= cas
oar 4 abe x <n
Dew
6 aw
cae 4
oan 4
ل سم
صفحه 108:
احتمای زیر ۶۵ جست؟
ل هوه
ow 4
one 4
was 4
our 4
aap 4
ow | ۵۲
oat 4
oa 4
Orades
صفحه 109:
باد آوری!
* احتمالات محاسبهشده دقیق هستند تنها اگر فروض ایجادشده
به طور واقعی درست باشند.
* وقتی محاسبات فوق را انجام میدهید. فرض شما این است که
دادهها به طور نرمال توزیع شده باشند.
۰ هميشه ابن فرض را جك كنيد! (بعداً ياد خواهيم كرفت)
صفحه 110:
آزمون فرضیه
مقدمه
صفحه 111:
برای دانستن خصوصیات یک
جمعیت بزرگتر» ازسیک نمونةً
تصادفی استفاده نمایید.
صفحه 112:
دو راه برای یادگیری در مورد یک جمعیت
* فواصل اطمینان
* آزمون فرضیه
صفحه 113:
فواصل اطمینان
* اجازه دهید که با استفاده از دادههای نمونه؛ مقادیر جمعیت
مانند میانگین يا نسبتهای واقعی را بر آورد نماییم.
* مثال: متوسط واقعی زمانی که دانشجوبان در آخر هفته مطالعه
می کنند. چقدر است؟
صفحه 114:
آزمون فرضیه
* به ما اجازه دهید که با استفاده از دادههای نمونه» یک ادعا در
مورد یک جمعیت را آزمون نماییم. مثلاً اینکه نسبتی از جمعیت
يا میانگین جمعیت برابر با یک عدد است.
* منال: آیا مقدار واقعی متوسط مطالعةّ دانشجویان در آخر هفته
۰ دقیقه است؟
صفحه 115:
Ov! عمومی آزمون فرضیه
* یک فرض ابتدایی بسازید.
* شواهد را جمعآوری کنید (دادهها)
* بر اساس شواهد موجود؛ تصمیم بگیرید که آیا فرض اولیه قابل
قبول است با خیر.
صفحه 116:
اجازه دهید که این فرضیه را نشان دهیم.
صفحه 117:
منال
[بافتويط قيرة سس
"/لااست؟
عقدو اعمال بوازد “كه 1
دانشجو دارای متوسط نمرهای
به اندازة ۹/۲ باشند اگر متوسط
حمعیت ۷/۲ باشد؟
صفحه 118:
تصمیم گیری
: آن محتمل یا غیرمحتمل است که ما شواهدی داشته باشیم که
فرض اولية ما را تأييد يا رد كند.
٠ (توجه: محتمل يا غيرمحتمل با محاسبة احتمال مشخص
میشود)
٠ اكر محتمل باشدء آنگاه ما فرض اولية خود را رد نمى كنيم.
يعنى شواهد كافى براى جيز ديكر نداريم.
صفحه 119:
تصمیمگیری (ادامه)
* اگر غیرمحتمل باشد. آنگاه:
- یا فرض اولیةٌ ما درست است و ما یک حادة غیرمعمول را تجربه
- یا فرض اوليةٌ ما نادرست است.
۰ در آمار: اگر غیرمحتمل باشد. ما تصمیم به رد فرض اولیه
فى كير يم.
صفحه 120:
ايده آزمون فرضیه
* اول دو فرضيه ارائه مى كنيم» فرضية صفر _
te call yobs ("iy") +
* و فرضية جایگزین
٠ oad the dtercaive hypothesis (“Te”)
خولنده كناهكر نيست:و را" -
خولنده كتاهكر لمست :و اك -
صفحه 121:
شناسایی فرضیهها
فرضیهای که نیازمند هیچ تغیبری در رفتار جاری ندارد.
* فرضیه جایگزین. نتیجهای است که محقق سعی دارد آن را
بدست آورد.
صفحه 122:
ادامة مثال
* سپس شواهدی مانند اثر انگشت. لکههای خون نمونههای موء
الیاف فرش رد کفشء نمونههای. دستخط و غیره جمعآوری
میشود.
* در آمان دادهها همان شواهد هستند.
صفحه 123:
ادامة مثال
* سپس_فرض اولیه ساخته میشود
- خوانده؛ بیگناه است تا وقتی که ابت شود گناهکار است.
* درآمار: ما هميشه فرض میکنیم فرضيٌ صفر درست است.
صفحه 124:
ادامة مثال
۰ 5 ۳ ۳7
سپس_یک تصمیم بر اساس شواهد موجود بگیرید.
- اگر شواهد کافی وجود داشت (ماورای شک منطقی)؛ فرضيةٌ صفر
رد میشود. (خوانده گناهکار است).
- اگر شواهد کافی وجود نداشته باشده فرضية صفر رد نمیشود
(خوانده گناهکار نیست)
صفحه 125:
نكتة مهم
* هیچ تصمیمی مستلزم اثبات فرضيةٌ صفر یا فرضية جایگزین
نمی باشد.
۰ ما فقط اظهار میداريم که شواهد کافی برای حرکت در یک
راه یا راه دیگر نداریم.
9 این موضوع هميشه در آمار درست است. موضوع این نیست
که ما چه تصميمي مى كيريم؛ هميشه شانس اين وجود دارد كه
ما تصمیم اشتباه بگیریم.
صفحه 126:
آزمون فرضیه
ادامة مقدمه ...
صفحه 127:
واقعیت
ERROR
OK
OK
ERROR
صفحه 128:
خطاها در آزمون فرضیه
واقعیت
فرضية جایگزین
۲
ERROR
OK
فرضية صفر
OK
Typed
ERROR
تصمیم
عدم رد فرضيةً صفر
رد فرضية صفر
صفحه 129:
تعاریف: انواع خطا
* خطای نوع اول: فرضيةٌ صفر رد شود درحالیکه درست است.
* خطای نوع دوم: فرضيةٌ صفر رد نشود. وقتی اشتباه است.
* همیشه شانس ابجاد یکی از اين خطاها وجود دارد اما هدف ما
باید حداقل کردن شانس وقوع این خطاها باشد.
صفحه 130:
ul متوسط درجة حرارت
بدن ۶/۹۸ درجه است؟ با
OT کمتر است؟
متوسط درجةٌ حرارت
بدن ۸۰ نفر بزرگسال
۸ درجه است.
صفحه 131:
منال (ادامه)
* تعیین فرضیه
درجه 96.0 ۶ ۲ :وبا -
درجه 90.8 > ۵ وبا -
* فرضيهٌ اولیه را 06.6 ۶ ۱ بسازید.
* جمعآورى دادهها: متوسط درجة حرارت بدن ۸۰ نفر
نمونه: ۴/۹۸ استى احتمال اين كه درجة حرارت بدن یک
نمونة 6١ نفره از بزركسالان كمتر از 5/48 باشدء اگر
دمای متوسط جمعیت ۶/۹۸ باشد. جه مقدار است؟
صفحه 132:
استفاده از ۱
برای تصمیمگیری
* ارس فشاندهنه احتمد لاسنکه ما چنیربونة کولنیرا مشاهده
خولهیم کرداگر فرفیة صفر دیستساشده
* سل ملحتم ل ؤستبنابيليربيرصفر و يكمياشد
٠ نزديك به صفر به معناى غير محتمل است.
٠ بنابرلين لكر .دم كوجك باشد (به طور مثال كمتر از /له» آنگاه
فرضیة صفر رد میشود.
صفحه 133:
منال (ادامه)
7-0 را بسه آسانیه ی ولاز نرهلفزلوهایآملووهانند MINITAB
بسآورد.
Test of mu = 98.6000 vs mu < 98.6000
The assumed sigma = 0.600
Variable N Mean StDev SE Mean 2 ۲
Temp 80 98.4 0.67 0.0671 -2.80 0.0026
p-value را عموماً با نشانمهند.
صفحه 134:
منال (ادامه)
* ام بسرلبر ۰۰۲۶/۰ نشانمهد که لگر دمایمتوسط
بسدندر جمعیت۶/۹۸ بساشد غیرمحتم|لستکه بسکضمونةً
۰ نفره بز رگسانلدارلعدمایمتو سطبدن۴/۹۸ باشنده
* تصمیم: رد فرضیةً صفر
* نتيجه اينكه دماى. متوسط بدن کمتر از ۶/۹۸ میباشد.
صفحه 135:
جه نوع خطایی ممکن است برای ما پیش آید؟
٠» خطاى نوع اول در اينجا ادعا در اين مورد است که متوسط دمای بدن
کمتر از ۶/۹۸ است درحالیکه واقعاً اینگونه نیست.
٠» خطاى نوع دوم در اینجا شکست_در اين ادعا که متوسط دمای بدن
کمتر از ۶/۹۸ است درحالیکه واقعاً اینگونه است.
ما فرضية صفر را رد كرديم يعنى ادعا كرديم كه دماى بدن كمتر از
۸ است بنابراين ما ممكن است خطاى نوع اول را داشته باشيم.
صفحه 136:
آزمون فرضیه برای میانگین یک
حمست
صفحه 137:
منال
[بافتويط قيرة سس
"/لااست؟
عقدو اعمال بوازد “كه 1
دانشجو دارای متوسط نمرهای
به اندازة ۹/۲ باشند اگر متوسط
حمعیت ۷/۲ باشد؟
صفحه 138:
مقادیر ۲
۳۲۵۲ < 2.9)
23024 25 26 28 29 30 31
27 X-bar
قدر محتمل است که ۱۰۰ دانشجو دارای میانگین نمرهای به اندازةُ ۹/۲
باشند اگر متوسط جمعیت ۷/۲ باشد؟
صفحه 139:
Ho: P= CLP متوسطن مرلنجمعیت<
Ha: P= OLR متوسطنمرلتجمعيت>
اگر ۱۰۰ دانشجو دارای متوسط نمرهای برابر ۹/۲ با انحراف معیار ۶/۰
باشد مقدار ۴ برابر است th
PA 2< 2.9( -7]2< )2.9- 2.7(/)0.6/-/100[
=HAZ>3.34=0.0004
صفحه 140:
تصمیم کیری
* مقدار ۴) کوچک است. غیرمحتمل است که ما نمونهای به
اندازةٌ ۹/۲ داشته باشیم اگر متوسط نمرات جمعیت ۷/۲ باشد.
* فرضية صفر رد مىشود. شواهد کافی وجود دارد که متوسط
نمرات بزرگتر از ۷/۲ باشد.
صفحه 141:
اصطلاحات
0 < لا تنب در ویر 9.6 2 لا :وبا ٠
یک آزمون فرضيٌ دنبالٌ راست یا یک طرفه نامیده میشود چون
مقدار 8) مربوط به دنبالة سمت راست است.
٠ بك - 9.69
را آمارة آزمون مینامند.
* اگر ها فکر کنیم که مقدار )ها کوچک است یعنی کوچکتر از
7 باشدء آنكاه احتمال ابنكه ها يك خطاى نوع اول بسازیم برابر
۰ است. این مقدار را سطح معنیداری آزمون مینامند. ما
میگوییم 0200.06 جاییکه 0 سطح معنیداری است.
صفحه 142:
ul متوسط درجة حرارت
بدن ۶/۹۸ درجه است؟ با
OT کمتر است؟
متوسط درجةٌ حرارت
بدن ۸۰ نفر بزرگسال
۸ درجه است.
صفحه 143:
مقادیو م
0۵2۲ > 984(
۶ 987 هوو 995 ووو 983
چقدر محتمل است که ۸۰ بزرگسال دارای یک دمای متوسط بدنی به اندازة
۸ باشد اگر متوسط جمعیت ۶/۹۸ باشد؟
صفحه 144:
متوسط دمایب دنجمیج 99.9 < Ho: BP
متوسط دمایب دنجمعی ۶ 96.9 < ۲ :114
اگر ۸۰ نفر بزرگسال دمای بدنشان ۴/۹۸ با انحراف معیار ۶/۰ باشد»
مقدار * برابر است با:
PX<984) =A Z<(984- 986)/(0.6//801
=A Z<- 2.99=0.001
صفحه 145:
تصمیم کیری
* مقدار ۴) کوچک است. غیرمحتمل است که ما نمونهای به
اندازة ۴/۹۸ بدسته آوریم اگر متوسط دمای بدن در جمعیت
۸ باشد.
* رد فرضيةً صفر. شواهد کافی برای اين نتیجه که متوسط دمای
بدن کوچکتر از ۶/۹۸ میباشد وجود دارد.
صفحه 146:
اصطلاحات
9 > لا :وبا در ph 99.9 2 لا :وبا
آزمون فرضية با دنبالٌ چپ یا یک طرفه نامیده میشود. چونکه مقدار PP
مربوط به سمت چپ است.
آمارة آزمونمپاشد 2.0.06 ر]" ۰
£ اگر ما فکر کنیم که مقدار * کوچک است؛ یعنی کوچکتر از etl
آنكاه احتمال اينكه ما خطاى نوج اول ايجاد كنيم برا ابر با ۰۲/۰ میباشد.
يعنى سطح معنىدارى برابر ©0.00) > 0. مى باشد.
صفحه 147:
آيا متوسط زمان صرف وقت
براى مطالعه ٠١ دقيقه است؟
مقدار متوسط ١7 دقيقه با
انحراف معیار ۱۶ دقیقه.
صفحه 148:
P pol
P(X-bar < 17) or P(X-bar > 23)
5 5 23 مج 17 ۱ 11
۳
چگونه محتمل است که ۶۲ دانشجو به طور متوسط حداقل ۱۷ دقبقه و حداکثر
۳ دقبقه صرف مطالعه کنند اگر متوسط جمعیت ۲۰ دقبقه باشد؟
صفحه 149:
تعیین مقدار ()
متوسطوقنصرفشده < Ho: B= OO
متوسطوقنصرفشده 900# = Ha: Pt
اگر ۶۲ دانشجوبه طور متوسط ۱۷ دقیقه با انحراف معیار ١ دقيقه صرف
مطالعه کنند» مقدار ۳ برابر است با:
AX<19=AZ<(17 20/0464]
=A Z<- 1.5]=0.067
» MWX>23=0.065
oly P-value = 0.067 x2 =
0124
صفحه 150:
تصمیم کیری
* مقدار ۴) کوچک نیستد محتمل است که ما یک نمونه به
کوچکی ۱۷ دقیقه و به بزرگی ۲۳ دقیقه داشته باشیم اگر
مقدار متوسط صرف شده ۲۰ دقیقه باشد.
* فرضيةٌ صفر رد نمیشود. شواهد کافی برای اینکه بگوییم
مقدار متوسط متفاوت از ۲۰ دقیقه است وجود ندارد.
صفحه 151:
اصطلاحات
00 # | :نبا" در pL 0 2 لا ٠ Wo
آزمون فرضية دو دنباله یا دو طرفه نامیده میشود چونکه مقدار
۴ در هر دو طرف میباشد.
آمارةٌ آزمونمیپاشد 1.5- < 2 ۰
جون ما در رد فرضية صفر شکست خوردیم ممکن است خطای
نوع اول را داشته باشيم.
صفحه 152:
* اگر دادهها به طور نرمال توزیع نشده باشند باید دارای یک
نمونة بزرگ مثلاً 60 < 2 باشیم.
صفحه 153:
نکتة بسیار مهم
* مقدار ۳ شما؛ صحیح نخواهد بود مگر اینکه فرضهای شما
درست باشد.
* اگر شما نمونة کوچکی داشته باشید. بایید ببینید آیا دادههای
شما به طور نرمال توزیع شده است يا نه
* اگر دادهها به طور نرمال توزیع نشده باشند» شما باید یک
gsi 8 بزرگ داشته باشید.
صفحه 154:
Destag Lypokeses Oude chou te Oru of Tue Popciows
START
1 Pdired t test (samples must coe
‘Are the Yes _frpm normal populations):
two samples
dependent?
z fest (normal distribution):
= 3) (tar pee)
2 2
a
Ake both, Population— Hse nonparametric metho}s
nprmally distributed?
Yes
Reject
‘After applying the F] of =o} sbparate variances ¢ test
test, what do we [amples must come fro!
condladd lormal populations)
apout Tail, to reject
fied variances f test (samples must 55۳
6 from normal ania where galt DS +(a-DS
عي 11
13 and df=n+n-2
به ۳
صفحه 155:
یاد آوری
عدم توجه به سطوح اندازه گیری در بکارگیری روشهای
مختلف آماری اعسم از آمار توصیفی یا استنباطی» اشتباه
رابجی است که در بسیاری از تحقیقات به چشم میخورد.
سطوح اسمی 560816 01۳01۳881 مقولات یک متغیر به
صورت قراردادی کنار هم قرار میگيرند. زن یا مرد (همسانی یا
ناهمسانی)
صفحه 156:
؟. در سطح ترتيبى :ordinal scale
جهت تغییر از کمبه زیادیا از ضعیف به شدید است. بنابرلين در لين سطح
علاوه بر همسانی یا ناهمسانی مقولات» شدت و ضعف و ترتیب آنها نیز
مشخص میشود ولی چون فواصل بین مقولات مشخص نیست اعداد
اختصاص يافته بهآنها از هم فاقد ارزش عددی است. يعنى نمى توان كفت
که فلانی سه برابر دیگری به تحصیل علاقه دارد.
صفحه 157:
Interval Scale cic سطح .۳
در این سطح علاوه بر تعیین سطوح مختلف و د تیب منطقی و واقعی oF
مقادير يك متغير؛ فاصلة بين مقادير متغير فوق نيز مشخص ميشود.
به عنوان مثال ميتوان كفت دانشجوئى كه نمره ٠١ كرفته است به اندازة ٠١
نمره با دانشجوئی که نمره ۱۰ گرفته است فاصله دارد.
در اين مقياس صفر مطلق وجود ندارد» مثلاً گر دانشجوئی در درس آمار
صفر گرفته باشد» نباید فرض کرد که اصولاً فاقد دانش آمار است
صفحه 158:
۴ سطح نسبی 560816 1۴۵0
بالاترین و دقیق ترین سطح اندایه گیری است که علاوه بر تعيين
سطوح و مقادیر یک متغير و تعيين فاصله بين مقادير يك
متغيرء نسبتها نيز قابل محاسبه و بيان هستند و مبناعه
اندازهكيرى نيز صفر مطلق است. مانند ميزان د رآهد يا حساب
دانشجو - در لین متفیر اگر حساب دانشجو صفر باشد واقعاً هیچ
پولی در حساب او نیست زیرا لین متغیر دارای صفر مطلق است
و وجود صفر حقیقی به عنوان مبدا اندازه گیری محقق را قادر
میسازد تا از روشهای مختلف آماری استفاده کند.
صفحه 159:
شاخصهای مرکزی
شاخصهای
پراکندگی
قرینه(سطح توزیع)
متقارن
یادآوری
ol ترتیبی
مد مد. میانه
اوانی ن
فراوانی نسبی چارکبند.
طبقات چارکبندی
فاصلهای یا نسیتی
مد. میانه. میانگین
واريانس
اتحراف معيار
دامنه تغییرات
چولگی
صفحه 160:
تحلیل روابط بین متغیرها
آمار توصیفی تنها میتولند تصویری از جامعه مورد مطالعه ارلئه دهد. اما
قادر به بیان رولبط بین متغیرها و تبیین متغیر یا متغیرهای وابسته نیست
زيرا در این سطح محقق در هر مرحله تنها با یک متفیر سرو کار دارد
محقق در تحقیقات مخت ف عمدتاً بدنبال تحلیل و تبیین دادههاو
متغیرهای موردنظر است به همین دلیل سعی Las استفاده از آمار
استنباطی به بررسی رولبط بین متغیرهاء تفاوت موجود در بین گروههای
مورد مطالعه و یا تبیین متغیر وابسته از طریق متغیرهای مستقل و غیره
بپردازد.
صفحه 161:
روابط بين متغيرها
* آیاارتباطی بین دو با چند متغیر وجود دارد؟ اگر جواب
مثبت است. این ارتباط در چه سطحی است؟
٠ء آيامىتوان تغييرات يك متغير رااز طريق متغير يا
8 } 5 .2
متغیرهای دیگر پیشبینی و تبیین کرد؟
پاسخ سژال اول از طریق تکنیک همبستگی و سّال دوم از طریق
روش تحلیل رگرسیون امکانپذیر است.
صفحه 162:
در رابطهبا تحليل دومتغيره رولبط من مها را ىفاك از ی () )١ جداول
توافقى '') ضريب
برای پیشگویی
ساده بهره جست.
در رابطه يا جمعييت جند متغيره؛ روابط متغيرها از طريق )١ ضريب
چند گانه و ۲) ضریب زئی و ی تغییرات
یک متغیر از طریق متغیرهای دی با استفاده از رکرسیون چندگانه
امکانپذیر است.
صفحه 163:
در حاشیه:
تفاوت عمدهٌ همبستگی و ر کرسیون
تفاوت رگرسیون با ضریب همبستگی درراین است که رگرسیون بدنبال
پیشبینی است در حالیکه ضریب همبستگی تنها میزان وابستگی دو متفیر
را با هم پررسی می کند.
در رگرسیون فرض بر این است که متفیر وابسته تصادفی و متفیرهای
توضیحی دارای مقذار ثابت باغیرتصادفی (در نمونه گیری تکراری)
میباشند. در همبستگی فرض بر این است که هر دو متفیر تصادفی
هستند.
- ضریب همبستگن قادر به بیان روابط le و معلولی بین متغیرها نیست.
صفحه 164:
جدول توافقی
هدف از تشکیل یک جدول توافقی نشان دادن هر
نوع رابطداى است كه ممكن است بين دو متغير
وجود داشته باشد. در مثال حاضر متغیرهای کیفیء
جنس (با سطوح مرد و زن) و رد کردن (با سطوح
بله و خیر) میباشد.
3
مرد
از روی جدول روشن میشود که در حقیقت رابطای
بين اين دو متغير وجود دارد. به طوری که واضحاً
نسبت بیشتری از پاسخدهند گان زذ؛ برنامه مورد
نظر را رد میکنند.
رد كردن
ay خير
30 20
10 40
صفحه 165:
ضرایب همبستگی مرتبط با متفیرهای اسمی
0 کایاسکوثر: یکی از آزمونهای ناپارامتری است. ۶
لین آزمون توسط فیشر ارلئه شد و قادر است تابه سنجش آماری
معنیداری تفاوت بسن فراوانیهای مشاهده شده و فراوانیهای
مورد انتظار بدست آمده از جامعه بپردازد.
لین آزمون نشان میدهد که UT تفاوت موجود بین مقادیر فوق از
نظرآماری معنیدار است یا این تفاوت عمدتاً براساس شانس
است.
صفحه 166:
شرایط استفاده از آزمون کایاسکوتر
دادههای مشاهدهشده بايد به صورت تصادفی گرد آوری شده باشند.
کلیه موارد موجود در نمونه باید مستقل از هم باشند.
حتیالامکان هیچ یک از خانههای جدول نباید کمتر از ۱۰ باشند (البته
برخی آماردانات تعداد ۵ مورد را ذ کر میکنند)
تعلواد نمونه بايد به اندازة کافی بزرگ باشد. پهتر است حجم نمونه در
اینگونه تجزیه و تحلیلها حداقل ۵۰ مورد باشد.
آماره کایاسکوثر میتواند برای یک متغیر اسمی و یک متغیر ترتیبی
نیز بکار رود.
کی ب العمل جهار نوع كود يا جهار سطح از يك ماده شيميائى در
دو خاک
صفحه 167:
۲ ضویب همبستگی جوپروف ()
* به منظور تعيبن شدت وابستگی بين متغيرهاى مورد مطالعه بكار
كرفته مىشود و مقدار لن همواره بين صفر و يك در نوسان
است. لین آزمون زمائیکه هر دو متفیر اسمس و یا یکی اسمی و
دیگری ترتیبی باشد مورد استفاده قرار میگیرد. اما نباید تعداد
سطر و ستونبا هم برابر باشندبه عبارت دیگر لین ضریب برای
جداول توافقی مستطیلی بکار گرفته میشود.
صفحه 168:
ضریب همبستگی فی 7
به منظور بررسی شدت همبستگی بین دو متفیر اسمی که به صورت
دووجهی و در قللب جدول توافقی میباشد مورد استفاده قرار میگیرد به
همین دلیل در اینگینه موارد بلید بجای انتتفاده از کایاننکویر» از ضریب:
همبستگی فی استفاده نمود.
* تفاوت ضریب همپستگ فی.با کایاسکوثر در لین است که کایاسکوثر
ن میکند در حالیکه
ضريب فى شدت همب ان مىدهند. اين ضريب
همانند كاىاسكوثر تفسير می گردد و مقدار آن همواره بین صفر و یک
صفحه 169:
۴. ضریب همبستگی توافق پیرسون
Pearson s coefficient contingency
لین ضریب که آنرابا 0 نملیش میدهند میزان همبستگی بین دو
متغیر اسمی را که به صورت توافقی تنظیم شدهاند محاسبه
می کند. این شاخص زمانی بکار میرود که خانههای. جدول
توافقی بیش از باشد.
صفحه 170:
۵. ضریب کرامر:
* این ضریب برای تعیین میزان شدت همبستگی پین دو متغير
اسمی مورد استفاده قرار میگیرد و آثرا با نشان میدهند که
مقدار آن همواره بین صفر و یک در نوسان است لین ضریب
در مقایسه با سایر ضرلیب انعطاف بيشترى دارد.به طوريكه هم
برای جداول توافقی بیشتر از و هم برای جداول مستطیلی بکار
میرود.
صفحه 171:
ضرائب همبستگی مرتبط با متغیرهای ترتیبی
صفحه 172:
ا. ضریب همبستگی رتبهای کندال
kendall s rank correlation
coefficient
شاخص کندال حللت تقارن داردبه لین معنا که متغیرها قرینه بوده
و برای محقق مهم نیست که کدامیک از متفیرهای مورد مطالعه
وابسته و کدامیک مستقل میباشد. لین شاخص مشخص می کند
که تا چه میزان افزلیش با کاهش در یک متغیر با افزلیش یا
كافش در متفیر دیگر همراه است» مقدار ضزییب کثذال هنواره
بین ۱- تا اه در نوسان است.
صفحه 173:
۲ ضریب گاما اه مممی؟)
شاخص است که از طریق ol میتوانبا آگاهی از پاسخهای یک
bal و نتلیج متغیر دیگر را پیشگوثی کرد. گاما در واقع
میزان کاهش خط را که در نتیجه آگاهی از پاسخ افراد در متفیر
مستقا رخ میدهد مشخص میکند.
صفحه 174:
۳ ضریب همبستگی رتبهای اسپیرمن
Gpeacvon (Rak Oorretaivd CoePPivieat
* اين ضریب زمانی مورد استفاده قرار میگیرد که دادهها به صورت رتبهای متوالی
ناپیوسته (... و ۳ و ۲ و ) باشد و یا لین که مقادیر اصلی به رتبه تبدیل شوند. در
صورتیکه دادهها با مقیاس فاصلهای یا نسبتی اندازهگیری شده باشند میتوان آنها را به
رتبه تبدیل کرد و بعد ضریب همبستگی رتبهای اسپیرمن را محاسبه نمود.
* ضریب همبستگی اسپیرمن که آنرا با ۲ نمایش میدهند همواره بین ۱+ و ۱- در
نوسان است و از لحاظ سطح سنجش نیز ترتیبی و از نوع متقارن میباشد به همین دلیل
برای محقق مهم نیست که کدام متفیر مستقل و کدامیک وابسته باشد.
صفحه 175:
ضریب همبستگی مرتبط با متغیرهای
فاصلهای با نسبی
صفحه 176:
ضریب همبستگی پیرسون
Prarsou Oorretativa OveFPicieat
* از روشهای پرکاربرد جهت تعیین میزان رابطه بین دو متغير
مصوب گردیده و با علامت ۲ نشان داده میشود. لین ضريب به
منظور بررسی رابطه بين دو متغیر فاصلهای یا نسبی مورد استفاده
قرار میگیرد و مقدار آن بین ۱+ و ۱- در نوسان است.
؟ اگر این ضریب مثبت باشد به معنای آن است که تغییرات در برد و
متغیر به طور هم جهت اتفاق میافتد و بالعکس.
صفحه 177:
فاصلهای با نسبی
دوحالنی
جندحالتی
aes چندحالتی
dae ضریب جوپروف
wv ‘ay
یب توافت
ضریب چویروف ی
ضريب كراصر oe
اضريب فى با كراصر
ot
- تن ۷ کرام
- ضريب فى لاندا
-کندال توا (برای جداول
توافقى (ox
- کندل او >(برای جداول
توافقی ستطبلی)
- ضویب همبستگی ربه ای
eel
wr
مقادير قاصله اى به رتبه اى
تبديل و ضريب هميستعى رقبه
أى اسبيرمن با كندال تائو
محاسية مى شود
فاصلهای با نسبی
عقادير فاصله اى به
رقبهاى تبديل و
ضریب همبستکی رتیه
أى اسبيرمن با كندال
ee tne شود
ضریب همبستکی
ome
صفحه 178:
GSS:
دو نکته در رابطه با ضریب همبستگی وجود دارد که توجه به آنها بسیار ضروری است.
للف- وجود همبستگی بین دو متغیر به معنای لین نیست که آنها دارای اثرات مساوی
هستند ویا یکی علت دیگری است. زیرا ممکن است هر دو تحت تأثیر عامل دیگری
tbl,
به عنوان مثال اگر بین میزان غیبت از کار و رضلیت شغلی رابطه متغفیر وجود داشته
باشد نمیتوان نتیجه گرفت که دلیل زیاد بودن غیبت عدم رضایت شغلی است زیرا ممکن
است که غليب بودن خود باعث احساس عدم رضلیت شغلی باشد ويا هر دو تحت
ثير عامل ديكر قرار كرفته باشد.
ب- همبستكى ساده نشان مىدهد كه بين دو متغير جقدر ارتباط خطى وجود دارد.
صفحه 179:
انتخاب آزمون مناسب برای مقايسة میانگینها
* چنانچه دادههاى مربوط به متغير وابسته از نوع كمى با مقیاس
(فاصلهای يا نسبی) و دادههاى متغير مستقل يا كروهبندى از نوع
کیفی با مقیاس (اسمی یا ترتیبی) باشد برای بررسی تفاوت ها
میتوان به مقایسه میانگینها پرداخت و معنیداربودن تفاوتهای
موجود بین طبقات یا گروهها را مورد بررسی قرار داد.
صفحه 180:
۰ ۳ وو
آزمونهای پارامتری
* آزمونهای ] و عمدهترین آزمونهای آماری برای مقايسة
میانگین گروهها میباشند. از آنجا که گروههای مورد بررسی
ممکن است مستقل با همبسته باشند بنابراین هر یک از
آزمونهای فوق به دو بخش مستقل و همبسته تقسیم میشوند.
تصميم كيرى در مورد این که در چه مواقعی باید از آزمونهای t
یا 7 مستقل یا همبسته استفاده کرد مهمترین مسأله در تحلیل
داده های کمی است.
صفحه 181:
صفحه 182:
پیشفرضهای آزمونهای پارامتری
آزمونهای پارامتری 1و *) را با پیش فرضهای زیر میتوان مورد استفاده قرار داد:
مشاهدات از یک جامعه نرمال انتخاب شده باشند.
اطلاعاتی که با هم مقایسه میشوند بلید تقریباً واربلنس یکسانی داشته باشند (در
نمونههای بزرگ اگر واریانس یک گروه دو برابر دیگری باشد باز هم میتوان از
آزمونهای پارامتری استفاده نمود)
دادههای گردآوری شده دارای مقیاس فاصلهای یا نسبتی باشند.
اگر اطلاعات جمع آوریشده لین سه شرط را نداشت میتوان دادههای فوق رابه غیر
پارامتری تبدیل کرد و از روشهای آماری غیرپارامتری استفاده نمود. روش عمده
تبدیل دادههای پارامتری به غیرپارامتری, رتبهبندی کردن آنها میباشد.
صفحه 183:
للف - آزمون؛ اگر متغیرمستقل یا متغیر گروهبندی تنها دو گروه داشته
باشد.
(اگر بخواهيم درآمد زنان و مردان را با هم مقایسه کنیم)
صفحه 184:
ب- آزمون 6(تحلیل واریانس (ANOVA
اگر تعداد گروهها بیش از دو باشد.
(اگر بخواهیم میزان درآمد گروههای شغلی کارگر, کارمند و کشاورز را با هم مقایسه کنیم)
نکته: آزمون 1۳ تنها معنیداری تفاوت بین میانگین گروهها را مورد بررسی قرار میدهد
اما مشخص نمیکند که لین تفاوتها در بین کدامیک از گروههای مورد بررسی وجود
دارد. به همین دلیل برای لیک که بدانیم تفاوتهای بدستآمده در پین کدامیک از
ت وجود دارد و از لين طریق مقایسهای بین گروهها انجام گیرد. بلید از ازمون شف
ob & Tukey s5 bel! 31, LSD & (Scheffe test)
7 استفاده کرد. لین آزمونها میانگین زوجها رابا همدیگربه صورت دوبدو
مقایسه کرده و وجود اختلاف معنیدار بین آنها را نشان میدهد.
صفحه 185:
این روش کل واریانس موجود در یک مجموعه از دادهها
را به دو بخش تقسیم میکند.
*_بخشی از این واربانس ممکن است بخاطر شانس و تصادف حادث شده باشد و بخش دیگر ممکن
است ناشی از دلایل یا عوامل خاصی باشد. از طرف دیگر واریانس موجود ممکن است ناشی از
تفاوت بین گروههای مورد مطالعه و یا بخاطر تفاوت موجود در درون نمونهها حادث شده باشد.
*_ مهمترین اصل در تحلیل واریانس (/۱60۷(/) آزمایش تفاوتهای موجود در بین میانگینهای
جوامع پا گروههای مورد مطالعه از طريق بررسى ميزان واريانس بين كرودها نسبت به واریانس
درون گروههاست.
*_ در واربانس درون جامعه فرض بر این است که تفاوت پین مقدار نسبت به میانگین جامعه بخاطر
شانس است در حالیکه در بررسی تفاوتهاى بين جوامع و كروههاء فرض بر اين است كه تفاوت بين
ميانكين جامعه يا نمونة لام با ميانكين كل به دليل عوامل خاص مى باشد. بنابراين زملنى كه از تحليل
واریانس استفاده میشود فرض میگردد که هر یک از نمونهها از یک جامعه نرمال انتخاب شدهاند
و هر یک از این جوامع نیز واریانس برابری دارند همچنین فرض میشود کلیه عوامل بجز عواملی
که مورد مطالعه میباشند تحت کنترل هستند.
صفحه 186:
در تحلیل واریانس, اگر در بین میانگین گروههای مختلف تفاوت معنیداری وجود
داشته باشد تنها از طریق 966066 نمیتوان محل این تفاوتها را بدست آورد.
اكر به مقايسة سه گروه (6 9۰60۰ بپردازيم و تفاوت معنىدارى در بين آنها وجود
داشته باشد نمیتوانیم قضاوت کنیم که لیا لين تفاوتها بین 09 و © است یا بين 68 و
دیاین وه
در چنین مواقعی نبلید از طریق آزمون ابه مقایسه دوبدو گروهها پرداخت, زیرا هر قدر
تعداد دفعاتی که آزمون !انجام میگیرد پیشتر باشد سطح اطمینان نتایج پائین میآید.
(در این موارد باید از آزمونهلئی مانند آزمون شفه. آزمون چنددامنه دانکن, آزمون SF
و آزمون استیودنت نیومن, کیول برحسب ضرورت استفاده کرد.
صفحه 187:
تحلیل واریانس یکطرفه:
Ovewoy @udbsts ۲ حول
اگر محقق تنها یک متغیر (درآمد) را انتخاب کند و بخواهد تفاوت بین طبقات یا گروههای
مختلف را بررسی کند در این صورت از تحلیل واریانس یکطرفه استفاده میکند.
تحلیل واربانس دوطرفه:
حجووبو() ۴و Two ww Ordpsts
لگر محقق بخولهد لثر دو علمل را بر روییک متفیر وابسته بررسی
كند بايد از تحليل وار بانس دوطر فه استفاده کند.
صفحه 188:
آزمونهای غیربارامتری
همانطوری که قبلاً نیز بعث گردید آزمونهای پارامتری علاوه بر
لين که نیاز به دادههلئی از نوع فاصلهای دارند بلید از برخی از
پیش فرضهای اولیه نیز برخوردار باشند (نرمال بودن توزیع در
جامعه و داث مه ود وی دهد چام
با هم مورد مقایسه قرار میگيرند و ...
صفحه 189:
* اما در آزمونهای غیرپارامتری چنین پیشفرضهائی مطرح نبوده و
زمانی که دادهها در سطح اسمی و يا ترتیبی باشد و يا در
صورتیکه گروههای مورد مطالعه از واریانس- نابرابر و یا از
چولگی برخوردار باشند بلید از آزمونهای غیرپارامتری استفاده
کرد. لین آزمونها از ویژگیهلئی برخوردار هستند که آنها را از
آزمونهای پارامتری متمایز کرده است:
صفحه 190:
.١ این آزمونها هیچکدام از پیشفرضهای مطرح شده در آزمونهای پارامتری, نظیر
نرمال بودن جامعه و يا برابر بودن واریلئس گروهها را مبنا قرار نمیدهد و حتی در
صورت صادق نبودن مفروضات فوق در خصوص دادههای فاصلهای به منظور استفاده
از آزمونهای پارامتری امکان تبدیل داده های فوق به دادههای غیرپارامتری و رتبهای
و محاسبه آزمونهای ناپارامتری وجود دارد.
۲_ از آنجا که در لين آزمونها از مقادیر رتبهای و حتی دادههای اسمی استفاده میگردد.
بنابراین محاسبة آنها کار سادهای است.
۳ این آزمونها در مقایسه با آزمونهای پارامتری از دقت بالائی برخوردار نمیباشند.
دلیل ن لین است که با تبدیل دادههای فاصلهای به مقادیر رتبهای, فواصل واقعی
موجود در بين دادهها به فواصل يكسان بين رتبهها تبدیل شده و در این فرآیند بخشی
از اطلاعات ناپدید می گردند a عبارت دیگر با تبدیل مقادیر اصلی و واقعی به مقادیر
رتبهای, بدلی از واقعیت ساخته میشود و لین بدل بدست آمده به جای واقعیت مورد
تجزیه و تحلیل قرار میگیرد.
صفحه 191:
انتخاب آزمون
غیریارامتری مناسب
صفحه 192:
: آزمورنشانه 4۰
زمانی که دادهها به صورت همبسته باشند مورد استفاده قرار
مرت
صفحه 193:
: آزمون مک نمار
۰ اغلب در مواردی بکار برده میشود که دادهها به
صورت اسمی و مربوطبه دو نمینه مرتبط Two) poet
0 با همسته باشند
(زمانی که بخواهیم نظرات قبلی و بعدی افراد را مورد
مقایسه قرار دهیم)
صفحه 194:
مثال۱. ابتدا در مورد یک موضوع نظر افراد را به صورت موافق یا مخالف جویا
میشویم پس از آن نسبت به برگزاری کلاس آموزشی اقدام میکنيم (یاجلسة توجبهی)
و سپس دوباره نظر افراد را نسبت به موضوع جویا میشویم. در اینجا فرض صفر
(10]) اين است كه تفاوتى بين نظرات افراد در قبل و پس از اجرای برنامه (دورة
آموزشی) وجود ندارد.
مثال۲. نظرات ۱۰۰۰ نفر درباره خرید و عدم خريد یک کالا قبل و بعد از برگزاری
برنامه تبلیغاتی و معرقی کالا پرسیده شده است با اين آزمون میتوان مشخص نمود که
آیا برنامه تبلیغاتی در تغییر نگرش مشتریان موثر بوده است یا خیر.
صفحه 195:
۳[زمون ویلکاکسون مه
* در بسیاری از پژوهشهائی که نمونهها به صورت جفت شده و
همبسته هستند ممکن است محقق بخواهد هم جهت تغییر و هم
میزان تغییر را مورد بررسی قرار دهد. برای اين منظور آزمون
ویلکاکسون تست مناسبی است.
* داده های مورد استفاده در این آزمون حداقل باید در سطح
ترتيبى باشند.
* مثال: نظر تعدادی از مشتریان در رابطه با دو نوع کالای مشابه
اما با مارکهای متفاوت از نظر کیفیت محصول سوّال شده است.
صفحه 196:
۴ آزمو & Fridman Test (ow p
آزمون فریدمن یکی از آزمونهای غیرپارامتری است لين آزمون در واقع معادل آزمون
F در روشهای پارامتری میباشد اما در اینجا برخلاف آزمون OAK توزیع نرمال
و برابر بودن واریانس ضرورتی ندارد.
این روش برای مقایسه سه گروه یا بیشتر از سه گروه همبسته بکار میرود.
مثال: نظرات ۲۰ نفر از فراگیران را درخصوص سه روش مختلف تدریس جویا شدهایم
و پاسخها نیز از ۱ (بسیار نامناسب) تا ۵ (بسیار مناسب) امتیازبندی شدهاند.
صفحه 197:
۵.آزمون کوکیان
یکی از روشهای ناپارامتری و درواقع تعمیمیافته آزمون مک نمار است.با اين تفاوت که
این روش برای مواردی که تعداد گروهها یا تکرار سه یا
دادههای لین آزمون به صورت اسمی میباشد و وجود تفاوت بین نظرات افراد را مورد
بررسی قرار میدهد.
مثال: نظرات افراد نسبت به یک موضوع در زمانهای مختلف پرسیده میشود
- قبل از برگزاری یک دورة آموزشی (موافقت - مخالفت)
- بعد از پرگزاری دوره (موافقت - مخالفت)
بعد از اجراى عملى محتؤيات دوره. (موافقت - مخالفت)
از سه باشد بكار م رود
صفحه 198:
۶آزمون من - ویتنی
Mann - Whitney Test
* برای مقایسه میانگینهای دو جامعه مستقل زملنی که دادهها به
صورت رتبهای یا ترتیبی باشند مورد استفاده قرار میگیرد.
* مثال: فرض كنيد دو كروه ۰ نفره از فراگیران با دو ریش
متفاوت اموزش ديده و نتيجه ارزيلبى انها از دورهدهاى فوق در
قالب امتیازات ۱ تا ۵ گرداوری شده است.
صفحه 199:
۷ آزمون کولموگروف - اسمیرنف
Kolmogrov - Smirnov Test
* چنانچه در بحث کایاسکوئر گفته شد اگر فراوانیهای مورد
انتظار بیش از ۲۰ درصد خانههای جدول, کمتر از ۵ باشد. در
این صورت نمیتوان از فرمول کایاسکوثر استفاده کرد. این
مشکل معمولاً زمانی پیش میآید که حجم نمونه کمتر از ۰ باشد
و یا تعداد خانههای جدول بیشتر باشد. در چنین حالتی میتوان
از تست کولموگرف - اسمیرنف استفاده کرد. اساس این آزمون
مقایسه فراولنی تجمعی نسبی مشاهده شده با فراولنی تجمعی
نسبی مورد انتظار میباشد.
صفحه 200:
A آزمون کروسکال - والیس
Kruskal - Wallis Test
* لین آزمون در واقع معادل تحلیل واریلنس یکطرفه میباشد, اما برخلاف لَن نيازى به
مفروضات لن نظیر اينکه نمونهها از یک جامعث نرمال بدستآمده باشند و یا اینکه
انحراف معیار یکسانی داشته باشند وجود ندارد. آزمون کروسکال والیس زماتی
استفاده میشود که تعداد نمونهها بیش از دو گروه باشد.
مثال: از ٩۰ نفر دانشجو در سه رشته مختلف درخواست شد تا کیفیت برنامههای
آموزشى دانشكده را ارزيلبى کفند: امتبازات. اراک شده توسط افراذ قوق از ١ (بسيار
ضعيف) تا 0 (بسيار قوى) در نوسان بوده است.
0 بین: ظرلتدلنشجویانر شتههایمختلف ت فارتمعنار یوجود ندارد.
این آزمون اگرچه وجود تفاوت بین نظرات گروههای مختلف را نشان میدهد اما
مشخص نمی کند که اين تفاوت در بین کدام یک از گروهها وجود دارد.
صفحه 201:
Median test s4ileo 49037
* یکی دیگر از روشهای غیرپارامتری است که برای مقایسه سه یا بیشتر از سه گروه مورد
استفاده قرار میگیرد. اطلاعات مورد نیاز در لین روش باید در سطح رتبهای بوده و
حتیالامکان دادهها همرتبه نباشند. زیرا اگر میانه مشترک بین گروهها جزو نمرات
تکراری باشد در اين صورت تشخیص تفاوت گروهها با مشکل مواجه میگردد.
* مثال: میخواهيم بدانیم لیا سرعت عمل کارگران سه شیفت مختلف یک کارگاه خیاطی
با هم متفاوت است یا خیر؟
* پرای لین کار تعداد شلوار دوخته شده توسط ۴۰ کارگر (از سه شیفت مختلف) در یک
هفته گردآوری شده است.
صفحه 202:
طبقهبندی روشهای تحلیل چندمتغیره
صفحه 203:
۰ انتخاب روش مناسب برای تجزیه و تحلیل دادهها مهمترین قدم
در تحلیل دادههای گرد آوری شده محسوب می گردد.
* متأسفانه به دليل عدم آشنائى با منطق حاكم ب بر روشهای
مختلف آمارى جند متغيره؛ به اشتباه يكى به جای دیگری
مورد استفاده قرار مى كيرد و تكنيكهاى مختلف به طور نابجا
بكار كرفته مى شوند.
صفحه 204:
به منظور آشناشی با نحوه بکارگیری روشهای چند متفیره در تجزیه و
تحلیل دادهها؛ درخت تصمیم گیری برای استفادهٌ اصولی و متناسب با
نوع دادهها و هدف تجزیه و تحلیل ارائه شده است؛
این طبقهبندی بر مبنای سوالات و مفروضات خاصی انجام گرفته است:
A
آیا دادههای مورد نظر قابل تقسیم به متفیرهای مستقل و متغیرهای
وابسته هستند؟
اگر چنین تقسیمبندی امکانپذیر است؛ چند متفیر از موارد فوق»
متغیر وابسته میباشند؟
متفیرهای موجود در تجزیه و تحلیل در چه سطحی اندازه گیری
شدهاند؟
صفحه 205:
پاسخ این سه سوّال محقق را در تصمیمگیری برای انتخاب
منأسبترین تکنیک تجزیه و تحلیل چند متغیره کمک میکند.
ياسخ سؤال اول مشخص مى كند كه آيا با يد از تكنيكهاى وابستككى
b » yi oe! (Dependenc Technique} پاید از تکنیکهای هم وابستگی
(Interodependence Technique) بهره گرفت.
روشهای وابستگی ON pie Ay pete de LS GT 59 ASF te SSeS
متغیرهای وابسته لحاظ شده و تغیبرات آسن براساس متفیرهای مستقل دیگر مورد
بررسی و تبیین قرار میگیرد مانند روش رگرسیون چند گانه یا تحلیل واربانس چند
متغیره و غیره.
روشهای هم وابستگی تکنیکهائی هستند که در آتن متغیرهای مستقل و وابسته
وجود ندارد؛ بلكه در آین روشها مجموعه متفیرها به طور همزمان و با هم مورد
تجزیه و تحلیل قرار می گيرند. مانند روش تحلیل عاملی.
صفحه 206:
روشهای تحلبل چندمتفبره
آيا بعضى از متغيرها وايستهائدة
1
صل | [سوپریی ۳ | سیشیت ] | [ مت
ل
rer يعد
ss ss
صفحه 207:
ore ی دی يدك سیم وابسته از نوع پارامتری باشده روش
مناسب برای تجزیه و تحلیل آن تحلیل رگر: انه است.
* چنانچه دادههای فوق دارای یک متفیر وایسته ake اما متغیر فوق از نوع غیرپارامتری
دووجهی باشده روش مناسب رگرسیون لوجیستیک و تحلیل تشخیص چند گانه است.
چنانچه متغیر وابسته غیرپارامتری چندوجهی باشد باید از تحلیل تشخیصی استفاده شود در
تحلیل تشخیصی متغیسر وابسته از نوع غیر پارامتری و متغیرهای مستقل از نوع پارامتری
اما چنانچه متغیرهای وابسته و مستقل هر دو غیرپارامتری باشند روش مناسب برای تجزیه و
تحلیل دادهها رگرسیون لوجیستیک میباشد.
تحلیل مسر روشی است که هم برای دادههای پارامتری و هم غیرپارامتری سازگار است.
اگر متفیرهای مربوط به موضوع مورد بررسی دارای چند متفیر وابسته باشد در این صورت
دو تکنیک دیگر برای تجزیه و تحلیل مناسب خواهند بود.
- اگر متغیرهای وابسته پارامتری باشند تحلیل واریانس چند متغیره یا تحلیل همبستگی
کانونی مناسب خواهد بود
- اما اگر متفیرهای وابسته مورد نظر غیر پارامتری باشد میتوان از طریق تبددیل آنها به
متغیرهای مجازی کدبندی شده به صورت (۰۱ ۰) از روش تحلیل کانونی استفاده کرد.
صفحه 208:
روشهای هموابسستگی بر مبنای وجود یعدم وجود متغیرهای
وابسته مورد تجزیه و تحلیل قرار نمی گیرند زيرا در لين روشها
کلية متغیرهابه طور همزمان وبا همدیگر بررسی میشوند لین
ع
روشها از نظر پارامتری یا غیرپارامتری بودن دادههابه دو گروه
جدا گانه تقسیم میشوند.
- پارامتری: تکنیکهای تحلیل عاملی و تحلیل خوشهای
- غیرپارامتری: دادههای غیرپارامتری از طریسق كدبندى متغير مجازی
(به صورت صفر و یک) قلبل بکارگیری در روشهای تحلیل عاملی و
تحلیل خوشهای هستند.
5 ع و 35
از سوی دیگر هم دادههای پارامتری و هم غیرپارامتری قابل
استفاده در تکنیک مقیاسبندی چندبعدی میباشند.
صفحه 209:
ر گرسیون
صفحه 210:
> آوری دادهها
* سه روش اصلى براعه جمع آورى ذاددها:
- مطالعات قبلی بر اساس دادههای تاربخی
- مطالعة مشاهدهای
- طرح آزمايشى (بهترين حالت)
صفحه 211:
کاربرد ر گرسیون
* توصیف دادهها
* برآورد پارامترها
* کنترل
صفحه 212:
نقش کامپیوتر
* تحلیل رگرسیون نیازمند استفادهٌ هنرمندانه و هوشمندانه از
کامپیو تر است.
)٩, 0۱۸۰ رصلام-86 ,86۳866 ,650665 ۰
صفحه 213:
. Zz
ركرسيون و مدل سازى
* تحليل ركرسيون: يك تكنيك آماره براى بررسی و
مدلسازی. ارتباط بین متغیرها
۰ کاربردها: مهندسی» علوم فیزیکی و شیمیایی. اقتصاد»
مدیریت؛ علوم زیستی و بیولوژیکی و علوم اجتماعی
* تحلیل رگرسیون شاید گستردهترین تکنیک آماری مورد
استفاده میباشد.
صفحه 214:
* تحلیل رگرسیون این امکان را برایه محقق فراهم میکند تا
تغییرات متغیر وابسته را از طریق متغیرهای مستقل پیشبینی و
سهم هر یک از متغیرهای مستقل را در بین متغیر وابسته تعیین
کند.
صفحه 215:
تحلیل رگرسیون و ضریب همبستگی
ركرسيون رابطة نزدیکی با ضریب همبستگی دارده بدين معنا كه
برای انجام رگرسیون باید ضریب همبستگی را محاسبه کرد.
اگر میان متفیرهای مورد مطالعه همبستگی وجود داشت تنها
در این صورت است که میتوانیم از رگرسیون برای آزمون
فرضیههای تحقیق استفاده نمائیم.
صفحه 216:
تحلیل رگرسیون
مفهوم رگرسیون برای اولین بار توسط فرانسیس گالتون در سال ۱۸۷۷
مورد استفاده قرار گرفت. او در مطالعه خود نشان داد که قد کودکان
متولد شده از والدین بلندقامت گرایش به برگشت به متوسط قد افراد
دارد.
وی در یک مقالة مشهور اظهار داشت: اگرچه تمایل برای والدین بلندقد به
داشتن فرزندان بلند قد و نیز والدین کوتاه قد به داشتن فرزندان کوتاه
قد وجود دارد اما متوسط قد بچههای والدین متعلق به هر طبقهٌ قدی
معين به طرف متوسط قد در کل جامعه برگشت با گرایش دارد
(Qeyess)
صفحه 217:
تعبیر نوین تحلیل رگرسیون
* تعبیر جدید رگرسیون کاملا متفاوت از حالت قبل است به طور کلی
میتوان گفت:
* تحلیلهای رگرسیون به مطالعة وابستكى يك متغير (متغير وابسته) به
یک یا چند متفیر دیگر (متغیر توضیحی) میپردازد که با تخمین یا
پیشبینی مقدار متوسط یا میانگین مقادیر متفیر نوع اول در حالتی که
مقادير متغير نوع دوم معلوم یا معیسن شده باشند (در نمونه گیری
تکراری) صورت میپذیرد.
صفحه 218:
صفحه 219:
+ و ۰ ۰ 5 w 5
تحلیل ر گرسیون در مقام مقایسه با تحلیل رابطة
علیت
* هرچند تحلیلهای رگرسیون وابستگي یک متفیر به سایر
متغیرها را بررسی می کند اما الزامً ببانگر حالت علست
نمیباشد. بنا به كفته كندال و استوارت يك رابطة آماری
see قوی و واضح هرگز نمیتواند پایٌ ارتباط علی (سببی)
قرار بگیرد. ایدههای ما از علیت باید خارج از حيطة آمار و
مالآ از تگوری با غیر آن حاصل شود.
۰ مثلاً نمیتوان گفت که بارند گی به عملکرد محصول وابسته
است.
صفحه 220:
تفاوت عمده همبستگی و ر گرسیون
& در رگرسیون فرض بر این است که متغیر وابسته تصادفی و
متغیرهای. توضیحی دارای مقدار اببت با غیرتصادفی (در
+ # . 5 ۳2 .
نمونه گیری تکراری) میباشند. در همبسستگی فرض بر این
است که هر دو متغیر تصادفی هستند.
* ضریب همبستگی قادر به بیان روابط علی و معلولی بیین
متغیرها نیستد
صفحه 221:
Sg 2۰ ۳ 8 و
ا گر وابستگی متفیری تنها بر روی یک متفیر توضیحی بررسی
شود. چنین بررسی به عنوان تحلیل رگرسیون ساده یا دو
متغیره معروف است.
é.. 2 ۰ 3 ۰ ۰ نت
اگر وابستگی یک متغیر بر روی بیش از يك متغير توضیحی
بررسی گردد؛ تحت عنوان رگرسیون م رکب معرفی میگردد.
صفحه 222:
رگرسیون خطی و غیرخطی
* خطى بودن از نظر متغيرها
و6 + رم حمق
Boxy + BX + ديل
* خطیبودن از نظر بارامترها
دو له + حجر
صفحه 223:
جزء استو کاستیک (تصادفی) تابع ر گرسیون
جامعه
جزء تصادفی جامعه () نماینده یا جانشینی برای تمامي متفیرهای
حذف شدهیا فراموششده که بر متفیر وابسته لثر میگذایند ولی
در مدل ر گرسیون وجود ندایند ليابه دللیل گوناگون نمیتوانند
در مدل گنجانده شوند).
Vi =P, + Box + Us
صفحه 224:
اهمیت جزء اخلال استو کاستیک و تعبیر آن
جزء استو کاستیک نمایندهای برای تمامی متغیرهائی است که از مدل حذف شده اما مجموعاً بر مواثر مى كذارد حال
ال این است که چرا این متغیرها صریحاً در مدل معرفی نمیشوند؟ به بیان دیگر چرا یک مدل رگرسیونی
هركب با ثمام متغيرهاى ممكن بسظ دادهنمیشوند.
دلايل فراوانى وجود دارد:
۱ _ ممکن است تلوری ناقص باشد یعنی از تًثیرگذاری بعضی از متفیرها بر متغیر وابسته بیاطلاع باشیم.ء
؟. ممكن است راجع به بعضى از متغيرها داددهاى اندكى داشته باشيم.
*. جمعآوری داده در مورد بعضی از متغیرها به نسبت تأثیر آنها در مدل ممكن است بسيار زياد باشد.
.2 به دليل ماهيت تصادفى بودن متغير وابسته؛ توضيح كامل آلن ممكن نيست و جزء اخلال مى توافد آثرا منكس
ممکن است در اندازه گیری خطا صورت گرفته باشد.
ع. با تأسی به قاعدة أکام (توصیف راجع به پدیدهها حتی الامکان ساده در نظر گرفته شود: و اینکه خلاف آنن
ثابت نشده است) مطلوب است مدل ر" را تا حد همکن سادهتر بگیرٍ
صفحه 225:
06 2 + ۰
تخمين مدل ر گرسیون دو متغیره
روش حداقل مربعات معمولی
Ordinary bewet Square (OLG)
برطبق فروض اصلی. روش حداقل مربعات چند خاصیت بسیار
جللب آماری دارد که یکی از مشهورترین و قویترین روشهای
تحلیل رگرسیون رابه وجود آورده است (لين روش به کارل
فردریک گوس ریاضیدان نامی آلمان نسبت داده میشود).
صفحه 226:
مشاهدات
3
صفحه 227:
ع
صفحه 228:
قاعدة کلی حداقل مربعات
۱
لا لا
=B, + Baxi t+ 4 رل
لا لا
بلا بر - و دو + رح بر
©+26-6+6+6
Mi 2 =S(y- y) =S(y- By- Bard)
صفحه 229:
روش حداقل مریعات؛ تخمینهای منحصر بفردی از 3
را كه كوجكترين مقلداو Sar را به نمركه outs aS
بدهدء مهيا مى سازد.
تخمین زنندههای حداقل مربعات
د | ع UN” LHSHN
و
1
رز( = By
1-۳
صفحه 230:
این تخمینزنندهها خصوصیات جالبی دارند که عبارتند از:
منحصراً برحسب مقادیر قابل مشاهده بیان میشوند (مثلاً و
در یک نمونه)
این تخمین زنها» تخمینزنهای نقطهای هستند یعنی در نمونه
داده شده با هر تخمینزن فقط مقدار منحصر به فردی (نقطه)
براى بارامتر جامعة مربوطه ارائه مىكند (بنابراين خط
ركرسيون را مى توان به آسانى برازش نمود)
صفحه 231:
فرضیات اساس روش حداقل مربعات
۶ اگر هدف ما تنپا تخ
تحلیل رگرسیون هدف
6 یو واقعی میباشد.
* براى رسيدن به ابن هدف نه تنها بايد شكل تبعى مدل را
معینی دربارة چگونگی بوجودآمدن 2و 1 را نیز مطرح سازیم:
ن الأو Po باشد. روش SOLO است اما به ياد داريم كه در
بدستآوردن ,6 و ريست Sb هدف استنتاجاتى دربارة
كنيم بلكه بايد فرضيات
J =B, + BX, + Y
* اين معاهله نشان میدهد که هم به :۲ و ۳ هميه لأ بستك, دارد. بنابراين نا زمانى كه
‘git 7 ديدست مل ند هيع راهى براك د اب به ۱
Po | تخواهيم داشت. از این رو فرضیات مبتنی بر متفیرن؟" و جزء خطا
برا تفسير ممتبرى از تخمیتهای ارگرمیون اهمیت Eo
صفحه 232:
آنچه به عنوان مدل رگرسیون خطی عمومی: گوسی. کلاسیک با
استاندارد معروف میباشد» مبتنی بر فرضیات زير است
قرفل سكين بها عيرس
Hulx,) =0
linge la ght Huddy yiilyl سمو :3 اللرومن سازأنست:
صفحه 233:
فرض ۲: عدم وجود خودهمبستگی بین ده
cotu,u)=Hu- Hu)|y- Au) =Huu,) =0
اكر بين دسها حالت الف یا ب وجود داشته باشد
آنگاه خودهمبستگی یا همیستگی پیوسته وجود
خواهد داشت.
صفحه 234:
فرض ۳: یکسانی (همسانی) واریانس 2)ها
vatulx) =Eu- Hu)|* =u) =0
Fu)
صفحه 235:
در مقلبل لين حللت شکل زیر واریلئس شرطی جامعةٌ 7 همراه با افزلیش
مقدار لا افزلیش می یلبد, لین حللت به ناهمسانی واریلنس و یا ناهمسانی در
پراکندگی معروف است.
F(x)
صفحه 236:
فرض ؟: کوواریانس صفر بین و ,6( ,,()
cotu, x) =Hu.x) =0
فرض نمودیم که »«و ب(که میتواند تأثیر تمام متغیرهای حذف شده را نشان
دهد) دارای تأثیرات جمع پذیر و مجزا بر مومیباشند اما اگر 26 و لد همبسته
باشند. تشخیص تأثیر خاص و مجزای هر کدامشان بر موممکن نیست. بنابراین
اگر و بدبه طور مثبت همبستگی داشته باشند 6ابا افزایش ب افزایش و با
كاهش ى کاهش مییابد به همین شکل اگر 2 و تبه طور منفی همبسته باشند
ابا افزايش 1 كاهش وبا کاهش ب افزایش مییابد وبه هر ترتیب جداکردن
تأثیر لاو بدبر ۷ مشکل است.
صفحه 237:
فرض ۵: مدل رگرسیون دقیقاً تصریح شده است
(عدم وجود خطای تصریح يا تورش)
سژالات فوق بسیار مهمند چراکه با حذف متغفیرهای اصلی از مدل انتخاب شکل تبعی غلط و یا
مطرح کردن قرضهای آماری نادرست دربارةٌ متفیرهای مدلء اعتبار تفسیر رگرسیون تخمینزده
شدهء زیر سوال خواهد رفت.
صفحه 238:
از ميان تمامى فرضهاء اين فرض انعطافناپذیر ترین و شاید در نظر اول دارای کمترین محل اعراب باشد.
يك مدل ركرسيون در يك تحقيق با تصريح مدل لبن در رابطه با يديدههاى مورد نظر شروع میشود.
بعضى از سؤالات مهم كه در تصريح مدل پدید میآیند عبارتند از:
١ چه متفیرهائی باید در مدل جای گیرند؟
شکل تبعی مدل چیست؟ آيا اين مدل از نظر پارامترها خطی است يا از نظر متفیرها و یا هردو؟
۳ فرضهای احتمالی ارائه شده در مورد؛ ,۷ و ,و بدهای درون مدل چه میباشند؟
صفحه 239:
متأسفانه در عمل: شخص به ندرت از متغیرهای صحیحی که باید در مدل منظور
شود. شکل تبعی صحیح و یا فرض احتمالی صحیح در مورد متغیرهای وارد
شده در مدل اطلاع دارد.
بنابراین در عمل کارشناس از بعضی قضاوتها در انتخاب تعدادی از متغیرهای
واردنشده در مدل یا شکل تبعی مدل استفاده کرده و برخی فرضها را در
مورد ماهیت تصادفی متغیرهای مشمول در مدل پیش می کشد و در انتخاب
مدل صحیح برای تحلیل تجربی تا حدی مستلزم آزمون و خطاست.
صفحه 240:
بر |كند كن ew قيلييس
صفحه 241:
Inflation
(%)
Unemployment
صفحه 242:
خصوصیات تخمین زنندههای حداقل مربعات: قضیةٌ گوس-
مار کف
یک تخمینزن ,]را زمانی میتوان بهترین تخمینزن بدون تورش خطی (0۷۵۵) از
6 دانست كه:
oN تخمينزن خطى باشد. يعنى تابعى خطى از يك متغير تصادفى مانند متغير
وابسته #ادر مدل ركرسيون باشد. رمه
تخمینزن بدون تورش باشد ۰۰ ۳/۰ (ي/
۳ تخمینزن در بین تمام تخمینزنندههای بدون تورش خطی: حداقل واریانس را
داشته باشد (تخمین زن بدون تورش با حداقل واربانس به تخمینزن کارا معروف
است).
صفحه 243:
Dre @ass-Oarhov :وه(
(PLOE).
1 min Var( 39) = Var(3q)
30:00 الك ار 90 > 0
)مما 8 min Var‘
3 91 الل لا
كك ۱۱
i B=
i
صفحه 244:
قضيةٌ گوس - مار کف
با توجهبه فرضهای مدل کلاسیک ر گرسیون حطی» تخمین زنندههای حدلقل
مربعات در بین تخمینزنندههای خطی. بدون تورش و دارای حداقل
واریانس یعنی 91,61(6) میباشند.
صفحه 245:
ضرائب تعیین /۷(معیار خوبی برازش) و ضریب
همبستگ re
ضریب همستگی:
0 ۲ میولند مثبتها منفیساشاد
این کمیت بین دو مقدار ۱+ و ۱- میباشد.
۳ این کمیت ماهيتاً فرینه میباشد یعنی ضریب همبستگی بين *او م یعنی ,۳معادل ضریب همبستگی
بين ۶و (یع) >« است.
؟. این کمیت مستقل از مبدأً و مقیاس اندازه گیری است.
۵ الو آمارى مستقل باشند ضريبٍ همبستككى بين آنها صفر است و 0 2 به این معنا
0
خوطی است و برای توصیف ارتباطات
See es ae Cons بیانگر یک ارتباط دقیق است اما میزان
۷ هرچندکه )بسكن خط wit aaah tegen ای
WS ge ce ly akg
صفحه 246:
م pete
x = x — x
© م 9
y y 1 8
ج منفى اما نزد يكك يهدصفر : مثبتاما نزد يككبه صقر > نزدیکک به و-
x x x
3 © م
0
صفحه 247:
در زمينة رگرسیون. گمعیار پرمعناتریه از «است چرا که ©م
نسبت تغییرات متفر وابسته توضیح داده شده به وسیلاً
متغیرهای توضیحی را ارائه میدهد درحالیکه -فاقد چنین
خصوصیتی است. به علاوه yor (R=) jes یک مدل
رگرسیون م رکب زير سژال میباشد.
صفحه 248:
شش برای حداکثر کردن RE
گاهی محققان سعی در حداکثر کردن ۲٩ دارند یعنی انتغاب مدلی که بالاترین 1۲۹) را به دست میدهد.
اما انجام این کار ممکن است خطرناک باشد زیرا در تحلیل رگرسیون هدف ما آن نیست که تنها یک
6 بالا به دست آوريم.
بلكه هدف بدست آوردن تخمينهاى قابل اطمينانى از ضرائب حقيقى ركرسيون جامعة اصلی و استنباط
آماری دربارة آنهاست.
در تحلیلهای تجربی بدست آوردن یک RO بسیار بالا چندان معمول نبوده بلکه حتی گاهی برخی از
ضرائب تخمینزده شدة رگرسیون از لحاظ آماری بیمعنی بوده یا دارای علامتهائی برخلاف انتظارات
بنابراين محقق بايد دقت بيشترى دربارة ارتباط منطفى يا تتوریکی متفیرهای توضیحی یا متفیر وابسته و
معنیداری آمارى آنها داشته باشد.
اكر 9 بالا بدست آوريم خوب خواهد بود اما اكر © بايين باشد اين امر به معنى بدى مدل نمىباشد.
صفحه 249:
فرض نرمال:
مدل ر گرسیون خطی نرمال کلاسیک
صفحه 250:
توزیع احتمالی اجزاء اخلال uy
برای کاربرد روش حداقل مربعات معمولی (9,ا)) در مدل کلاسیک
رگرسیون خطی؛ هیچ فرضی در مورد توزیع احتمالی جزء اخلال با
ارائه نکردیم.
تنها فروضی که در مورد به مدنظر قرار گرفت عبارت بودند از این که
اجزا مذ کور دارای امید صفره عدم همبستگی و واریانس ابت هستند.
صفحه 251:
* اگر هدف ما تنها تخمین پارامترها باشد در اینصورت
روش ,ا) کافی خواهد بود اما تأکید بر تخمین تنها
یکی از جنبههای استنتاج آماری است و جنبة دیگر آزمون
فرضیه میباشد.
* از آنجا که هدفمان هم تخمین پارامترها و هم آزمون
فرضیه است. لذا احتیاج به تعیین توزیع احتمالی جزء
اخلال به خواهیم داشت.
صفحه 252:
فرض نرمال بودن
Ay) =0 میانگین *
Au?) =o?
* واریانس
Auu,) =0
We UM کوواربانس *
صفحه 253:
طبق قضية مشهور آمارى حدى مرکزی میتوان نشان داد که اگر
با تعداد زیادی از متغیرهایه مستقل و تصادفی که دارای توزیع
احتمللی یکسانی هستند مواجه باشیم در این صورت به استثناء
چند حالت خاص با افزایش تعداد متغیرها به سمت بینهایت
توزیع مجموع آنها به سمت توزیع نرمال ميل مى كند.
صفحه 254:
خصوصیت تخمینزنندههای )ا() تحت فرض
نرمال بودن
١ بدون تورش هستند
۲ دارای حداقل واریانس هستند
۳ سازگاری: یعنی همانطور که حجم نمونه به سمت بینهایت افزایش مییابد.
تخمینزنندهها نیز به مقادیر جامعهشان نزدیک میشوند
۴ _ژبه طور نرمال توزیع شده است
0 رثلیه طور نرمال توزیع شده است
ع عبارت یل ر) از توزیع کایدو با درجة آزادى (©-(0) تبعيت مى كند.
و
a A op از . زلوزیم شداند.
/ در گروه تخمینزنندههای بدون تورش خطی يا غیرخطی دارای حداقل
2
واریانسن هستند
صفحه 255:
صفحه 256:
ر گوس 3 دو متغيره:
تخمین فاصلهای و آزمون فرضیه
صفحه 257:
فاصلة اطمینان
از آنجائیکه فاصلاٌ اطمینان تصادفی است. احتمالهای بدست آمده میبایست در معنای
درازمدت فهمیده شوند؛ یعنی نمونه گیری تکراری به طور مشخص,تر به این معنی
است که: اگر در نمونه گیری تکراری؛ فواصل اطمینان
(plZ,- exp <A, +e)=1- a)
پراساس احتمال « تعداد زیاد ساخته شوند آنگاه در درا
a) -1
چنین فواصلی در مورد از تعداد کل موارد» مقدار حقیقی پارامتر را در بر
"00 له -1)
هى كير ند.
مدت به طور متوسط
صفحه 258:
آزمون فرضیه و انتخاب سطح معنیداری
خطاى نوع اول: احتمال رد كردن فرضية درست.
خطاى نوع دوم: احتمال قبول فرضيةٌ نادرست.
براساس هزينة هر كدام از خطاهاى فوق. محقق اقدام به انتخاب
سطح معنى دارى خواهد نمود.
صفحه 259:
نقض فروض مدل
کلاسیک
مدل کلاسیک رگرسیون خطی نرمال براساس چند قرض ساده شده به شرح زیر است:
فرض ۱: میانگین شرطی جزء اخلال جامعه مشروط به مقادیر مفروض متفیرهای توضیحی
phe (Lox) است.
فرض ۲: واریانس شرطی ب ثابت یا همسان است.
فرض ۳: خودهمبستگی در اجزا اخلال وجود ندارد.
'. فرض ؟: متغيرهاى توضيحى غير تصادفىاند. حتى اگر تصادفی هم باشنده مستقل از اجزا
اخلال ى توزیع شدهاند.
فرض 3: بين متغيرهاى توضيحى (ها) همخطى مركب وجود ندارد.
فرض۶: به ها به طور طبیعی با میانگین و واریانس داده شده در فروض ۱ و ۲ توزيع شدهاند.
فرض ۷: مدل رگرسیون به طور صحیح تصریح شده است؛ یعنی تورش تصریح وجود ندارد.
صفحه 260:
با این فروض دیدیم که تخمینزنهای حداقل مربعات
معمولی (01:08) ضرائب ركرسيون, بهترین تخمین زنهای
بدون تورش خطى 8|000 مى باشند.
فروض ۰۱ ۲ و ۶ را به دلایل زیر به طور مفصل مورد بحث قرار نخواهیم داد:
فرض : امید صفر جزء اخلال: اگر ایین فرض تأمین شود نمیتوان ان عرض از مبدأ
اصلى را تخمیسن زد و چون در بسیاری از حالتهای کاربردی» جزء عرض از مبدأ
اهمیت اچیزی دارد چندان تأثیری نخواهد داشت.
فرض ؟: حللت تصادفیبودن متفیرهایی توضیحی: اگر «هابا وجود تصادفیبودن به
طور مستقل از دها توزیع شوند آن گاه براء ای تمام مقاصد کاربردی ها را میتوان
غیراستو کاستیک فرض كرد.
فرض۶: نرمال بودن به اگر هدف ما صرفاً » لین فرض ضروری نیست.
فرض نرمال بودن به منظور آزمون فرضیه و پیشبینی بسیار مهم است.
صفحه 261:
همخط یکی از فروض مدل کلاسیک رگرسیون خطی این است
که هیچ گونه همخطی مر کب بین متفیرهای توضیحی
isle موجود ون مج ورد Outicolicearity
36 2
do 90 توجه داشته باشيد كه هم خطى
5 تنها ارتباطات خطی بین
ص 5 متغيرهاى كا را شامل مى شود
8 عد و ارتباطات غيرخطى بين آنها
را در بر نمیگیرد.
do 90
V=Bo* BX + BX + BX + Uy 66 deo
aso 50
اگر همخطی وجود داشته باشد ضرائب رگرسیونی
متغیرهای نامعین و انحراف معیارشان بینهایت است.
(همخطی کامل) همخطی ویژگیهای 15لاا8 بودن
تخمینها را نقض نمی کند.
صفحه 262:
یج عملى هم خطى
الف - بز ركى واريانس و كوواريانسهاى تخمين زتهاى 08ر01
ب- فواصل اعتماد عریضتر: احتمال قبول شدن يك فرضية غلط (مثلاً خطاى نوع دوم)
ج- نسبتهاى غيرمعنادار wr مقادير ؛ كوجك مىشوند و فرضية صفر به معناى صفربودن
بارامترهاى جامعة واقعی مورد قبول واقع میشود.
د- 09 بالا اما تعداد اند ک نسبتهای معنادارء
ه حساسیت تخمینزنهای را و خطای معیار آنها نسبت به تغییرات اندک در دادهها
صفحه 263:
کشف همخطی
الف-
.١ در همخطی سژال از درجه است نه از نوع. تمایز معناداری يبن حضو
عم شور همخطی وجود ندارد؛ بلكه تمايز بين درجات گوناگوا
است.
۲ از آنجایی که همخطی به شرایط متغیرهای توضیحی برمی گردد که
فرض شاو غيرتصاذفى باشند لذا ابن حالت شكلى
oto.
از نمونه است نه
جامعه بنابرایین ماآزمون برای همخطی صورت نمیدهيم. بلکه میتوان
درجهاش را در نمونهٌ مشخص اندازه گیری نمود.
اب-
.١ 09 بالا اما تعداد كم نسبتهاى ؛ معنى دار
شدید بین دویدو متغیرهای توضیحی
۳. امتحان ضرائب جزئی
؟. ركرسيونهاى معين
۵. ريش مشخصه (صسمب8©) و شاخص وضعيت (ط-1/ مصطده9©)
در برنامة 585 از ريشة مشخصه و شاخص وضعيت براى تشخيص همخطى استفاده مى کنند.
صفحه 264:
رفع مشکل هم خطی:
قاعدة محکم و دقیقی جهت چارهجوئی مشکل وجود ندارد؛ چرا که همخطی
bel II یک مشکل نمونهای است.
.١ اطلاعات قبلی (تئوریکی)
۲ تركيب كردن دادههای مقطعی و سریهای زمانی (دادههای مر کب)
*. حذف متغيرها و تورش تصريح
؟. تبديل متغيرها
۵
دادههای جدید يا اضافی (افزایش حجم نمونه)
صفحه 265:
ناهمسانی واریانس Wetervsvedusticity
یکی از مهمترین فروض مدل ر گرسیون خطی کلاسیک این است که اجزاء
اخلال بد که بر تابع ررگرسیون جامعه ظاهر میشوند. دارای واریانس همسان
Ely) =0°
هستند.
يا
با افزايش يك متغير (درآمد) متوسط متغير ديكر
.بس انداز) افزايش مى يابد
Gadel say
صفحه 266:
اگر فرض ناهمسانی را جایگزین فرض همسانی نمایيم تخمینزن aya Bp
۵ هست اما دیگر کارا یا بهترین نیست و دارای حداقل واریانس نیز
نمیباشد در این حالت از روش تخمین معروف به حداقل مربعات تعمیمیافته
(0۷۵) استفاده مینمائيم
نتایج کاربرد روش OLG در شرایط وجود
ناهمسانی واریانس
* فاصلٌ اطمینان براساس بیش از حد لازم بزرگ خواهد شد و در نتیجه
آزمونهای !و ۴) احتمالا نتیج غلطی به ما خواهند داد.
صفحه 267:
کشف ناهمسانی واریانس
روش ترسیمی:ابندا رگرسیون را براساس
فرض عدم ناهمسانی تحلیسل کرده و سپس
مجذور باقیماندههای تخمینزده شده هرا
مورد بررسی قرار داد تا ببینیم چه الگوی
سیستماتیک و منظمی را نشان میدهند.
واریانس جزء اخلال به طور خطی یا متفیر >
مربوط است.
۲. . آزمون پارک: پارک روش گرافیکی را
در قالب فرمول بیان داشته است.
۳ _ آزمون گلدفلد- کوانت
۴ _ آزمون گلچس
۵ آزمون بروج پاگانت
ع. آزمون وایت
صفحه 268:
یکی از فروض مهم مدل کلاسیک اين
است که خودهمبستگی سریالی بین اجزاء
اخلالی که در تابع رگرسیون جامعه وارد
میشود وجود ندارد.
ماهیست خودهمبستگی: همبستگی بسن
اعضای سریهای مشاهداتی است که در
زمان (سریهای زمانی) یا مکان (دادههای
مقطعی) ردیف شدهاند.
Alyu,) 40 j#7
ش ۳ اگر محصول در یک فصل کم باشد دلیلی بر کم
1 بودن محصول در فصل دیگر نمیباشد
(عدم خودهمبستگی)
صفحه 269:
تخمین ۸69( در حالت وجود خودهمبستگی
55 * در حالست خودهبسستگی تخمینزن CLG
۵ تخمينزن 5 act BLOB co pet
SHOVG ۰ چنیسن خصسوصیتی ندارد. تخمینزن
اطلاعات موجود بيشترين را میکند.
a. * _ درحالت وجود خودهمبستگی نیز همانند حالت
تخمينزنهاى 01/08 خطى و بدون
ش و لذا سازكارند ولسی کارا نیستند (یعضی
Seal نمسای
فاصلة اعتماد مب درصد در هل0 و GLS 3
bole J ندارند)
* . فواصل اعتماد بزرگتر از حالت معمول خواهد پود
OV) به 0۵)
صفحه 270:
تخمین ۵)باا) بدون در نظر گرفتن
خودهمبستگی
- احتمالاً واریانس باقیمانده مقدار واقمی سیگما به توان دو را کمتر از حد
تخمین میز
در نتيجه 089 بيش از حد تخمين زده مىشود.
- آزمونهاى معنىدارى !و “) معتبر نيستند و اگر آنها را بكار_يبريم نتليج بسيار
غلطى در مورد معنىدارى آمارى ضرايب تخمينزده شدة رگرسیون بهدست
خواهيم آورد.
صفحه 271:
زمون دوربین واتسون : مشهورترین آزمون تشخیص همبستگی سریالی است DD
فروض زیربنایی آزمون 0.00)
مدل ر گرسیون دارای جزء عرض از مبداً اسث
۲. متفیرهای توضیحی غیرتصادفی هستند
۳ اجزاء اخلال به وسیلهٌ الگوی خود ر گرسیونی مرتبه اول
حاصل میشوند.
؟. مدل ر گرسیون شامل مقادیر با وقفهای از متغیر وایسته
به عنوان یکی از متغیرهای توضیحی نیست.
۵ هیچ مشاهدةٌ مفقودهای در دادهها وجود ندارد.
صفحه 272:
1
3
+
یکی از فروض SW تصریح مدل بودبه عبارت دیگر فرض بر لین بود که تورش یا
خطای تصریح در مدل وجود ندارد. این موضوع بسیار گسترده و پیچیده میباشد و بسیاری از
مباحث آن بالاتر از سطح مفروض ما میباشد.
این قسمت دوب كيرئدة مسائل زیر است:
مدل خوب با صحیح متضمن جه خصوصیاتی است؟
فرض كنيد كه يك مدل صحيح براى تحليل يك مسألة خاص ارائه شده است امابه علت در دسترس نبودن
آمار و ارقام» سهلانگاری. ملاحظات هزینهای یا ستی. مدل متفاوتی را بکار بردیم و بتابراین نسبت به مدل
صحيح مرتكب خطاى تصريح شدهايم. حال سؤال اين است كه در عمل وقوع جه نوعى از شکلهای مختلف
خطاهاى تصریح وجود دارد؟
نیج انواع مختلف خطای تصریح کدامند؟
طرق كشف اين نوع خطاها كدامند؟
اكر به ارتكاب خطاى تصريح بى برديم جه راههابى براى دستبابى و بركثت به مدل صحبح وجود دارد؟
در ۵ مورد بالا فرض بر اين بود كه يك مدل صحيح وجود دارد وما مايل به دانستن مشكلات عارض
در اثر كاربرد مدل ديكرى بوديم اما اككر اصلا ندانيم كه كدام مدل صحيح است دجار خطاى تعيين غلط
مدل مى شويم كه با خطاى نوع قبلى يعنى خطاى تصربح متفاوت است.
صفحه 273:
خصوصیات یک مدل خوب
منطقی متغفیرهای توضیحی: یک فرضیه (مدل) زمانی با ارزش و مهم خواهد بود که مقدار زیادی
از تغييرات را به وسيلة تعداد کمی از متفیرها بتوان توضیح داد.
قابليت ت
براى مجموعه داده های معین, بارامترهاى تخمين زده شده بايد مقادير منحصر بفردى
ات تنها یک تخمین برای هر پارامتر مشخص به دست ۲
خوبی برازش:
سا زگاری با تثورى
قدرت تعمیم دهی و پیشنگری: تنها آزمون مناسب برای اعتبار یک فرضیه (مدل) مقایسة پیش بینی
آنها تخاب اسنت:
صفحه 274:
انواع خطای تصریح
وارد کردن متغیر غیرلازم ۳
درنظر كرفتن يك شكل تبعى
خطای در اندازه گیری
صفحه 275:
نتايج خطاى تصريح
حذف يك متغير مهم:
- ضرایب رگرسیون اشتباه بر
اه تخمین زده می شود.
أ فاصلة اطمينان و آزمون فرضيه نتايج گمراه کننده ای را راجع به معنادار بودن آماری
پارامترهای تخمین زده شده به دست می دهند.
* لحاظ کردن یک متفیر نامربوط
- تخمینها ناتور و ناسا ز گارند
انس خطا درست بررآورد می شود.
رد می شوند (تورشدار, ناسا زگار)
و
- آزمون فرضيه و فاصلة اعتماد معتبر مى باشند.
- به طور کلی ضرایب بر آوردشده غیر کارا هستند یعنی واریانس آنها عموماً بزر گتر از
واریانسهای ضرایب حقیقی می باشند. (دقت کم در استنتاجهای احتمالیپارمترها) (احتمال
ایجادشدن مشکل همخطی را نیز زیاد می کند) (درجة آزادی را کم می کند)
صفحه 276:
آزمونهای کشف خطای تصریح
* کشف وجود متفیرهای غیرلازم
- آزمون معنادار بودن ضریب متغیر اضافه (آزمون ۴
* آزمونهای راجع به متغیرهای حذف شده و شکل تبعی غلط
- استفاده از بآقیمانده ها (ملاحظة گرافیک این باقیمانده ها)
- آزمون اتح) رمزی
- آزمون نسبت راستنمایی
= آزمون والد
- آزمون ضریب لاگرانژ
- آزمون هاسمن
صفحه 277:
استفاده از باقیماندهها (ملاحظهٌ گرافیک این
باقیماندهها)
0 iy 8
ouput
Residuals
@ 0 0
Residuals 0 from (a) linear, (b) quadratic, and (c) cubic total cost functions.
صفحه 278:
2 5 5
ر گرسیون بر روی متغیرهای موهومی
* در بسيارى از تحليلهاى ركرسيونى؛ متغير وابسته نه تنها تح تتأ
تولید. ميزان كود مصرفى....) با مقياسهاى متداول استء بلكه از
(جنس نژاده ..
متغیرهای (مثل
های 82 کیفی
نيز تبعيت هى كند.
* نظربه اينكه متغيرهاى كيفى عموماً دلالت بر وجود يا عدم وجود كيفيت یا صفتی دارنده لذا
يك روش براى كمي كردن ايز صفات.درنظر كرفتن متغيرهاى ساختكى با قبول دو مقدار
ضفر و يك مىباشد كه صفر بيانكر عدم وجود لن صفت و يك حاكى از وجود آن مىباشد.
به این ترتیب متفیرهایی که اين مقادیر صفر و یک را اختیار میکنند؛ متفیرهای موهومی
(طاطجه0 برس نام دارند.
* اسامی دیگر اين متغیرها عبارتند از متفیرهای دلالت کننده بر یک صفت. متغفیرهای دوتایی؛
متغیرهای طبقهای متفیرهای کیفی؛ متفیرهای منقسم به دو متغيرهاى مجازی.
صفحه 279:
* متفیرهای موهومی به همان سادگی متفیرهای کمی در تحلیل رگرسیونی به
ار میروند.
اگر چنانچه یک مدل رگرسیونی تنها بر حسب متفیرهای توضیحی موهومی یا
کیفی بیان شده باشند. آن را مدل آنالیز واریانس مینامند.
در بیشتر تحقیقات اقتصادی. معمولا یک مدل رگرسیون شامل چندین متغیر
توضیحی ميباشد که تعدادی از آنها کمی و بقیه کیفی میباشند. این گونه
مدلهای ر گرسیونی که شا د فرع ln کمی و کیفی هستند را
مدلهای آنالیز کوواریانس (۷ 6/6 مینامند.
قاعدة کلی برای تعداد متغیرهای موهومی: چنانچه متغیر کیفی موردنظر دارای
طبقه باشد؛ آنگاه بایستی فقط به تعداد 111-1 متغیر موهومی در مدل
منظور شود در غیر اینصورت در دام متیر موهومی گرفتار خواهیم شد (همان
حالت ایجاد همخطی کامل بین متغیرهای موهومی)
صفحه 280:
رگرسیون بر روی یک متغیر کمی و یک متغیر کیفی با یش
از دو طبقه
پیش بینی تلفات برداشت گندم و تحلیل داده ها به روش مدل متفیرهای موهومی
(کد مقاله ۵۲ع)
احسان مصدری[۱]؛ محمد حسین عدالت|[۲] ۰ محمد جواد غلیلی[۳] : حمید طاهرپور کلاتری[1]
مجموعه مقالات پنجمین کنگرهٌ ملی مهندسی ماشینهای کشاوزی و مکانیزاسیون
صفحه 281:
مدل متغیرهای موهومی گونه ای از مدل های رگرسیونی است که بوسیله تن مي توان
اثر متفیرهای کیفی را بر روی متغیر وابسته سنجید. این مدل ها مي توانند فقط از
متغیرهای موهومی (کیفی) تشکیل شده باشد که در این صورت OT را مدل آنالیز
واربانس می نامند و یا می تولند تر کیبی از متفیرهای موهومی و کمی باشد که در اين
OT را مدل آنالیز کوواریانس می امند.
های کیفی را بایستی با استفاده از روش مناسب به صورت صفر و
che تخمين مدل در اين مطالعه از یک تابع خطی به شکل زیر استفاده
كه در ان نشان دهنده متغيرهاى مستقل و نشان دهنده متغير وابسته و مقادير و
ضرلیبی است که در پی زدن هستيم. اين مدل با استفاده از روش OLS به
راحتی قلبل تخمین است .اما شیوه تفسیر ضرلیب متفیرهای موهومی متفاوت خواهد بود.
متفیرهای مستقل وارد شده در لین مدل جهت تخمین رابطه ریزش شامل منطقه واریته
گندم؛ مدل کمبایین: نوع کشت؛ ؛ عملكرد؛ عصر کمباین؛ تاریخ برداشت و سافت
برداشت میباشد. متنیر وابسته درصد ریزش است که حاصل جمع ربزش عملیات
برداشت و ریزش طبیعی محصول میباشد.
صفحه 282:
2 + رنیرت +9292 2 نآ یروق کرو | 3 قآ رروروق/ 05/02 B sradaySAAAL,
| yyogegM OE Bn ¢ ODF Bry yp TATIKEt كرريع أ
*_متنیر منطقه دارای چهار حللت مشهد. تربت جاءء خواف و تایباد می باشد كه از لين ميان منطقه مشهد
به عنوان وضعیت پلیه التخاب شده و سایر مناطق به ترتیب با متغير هاى 1662 :10۳۳2102۳0 و
0 وارد الگومی شود. در لین صورت چنانچه مقادیر هر سه ناحیه برابر صفر باشد نشان دهنده
شهرستان مشهد اگر متفیر 1011021[210 برابر یک باشد و سایر متفیرها صفر باشند نشان دهنده
تربت جام و اگر متفیر 1108 برابر یک باشد و سایر متفیرها صفر باشد نشان دهنده شهرستان خواف و
در نهلیت اگر متفیر 121020 برابر با یک و سایر متفیر ها صفر باشد نشان دهنده شهرستان تایباد
خواهد بود.
ساده شر پرای هر شهرستان بیک متغير كيفى تعريف شده است كه مقدار يكء نشان دهنده
تان و مقدار صفر نشان دهنده برداشت در یک شهرستاد ن دیگر می باشد. برای هر
مشاهده حداکثر یک متفیر برابر با یک می شود و سایر مناطق صفر است. همانطور که قبلا گفته شد
اگر مقدار هر سه متفیر صفر باشد نشان دهنده شهرستان پایه یمنی مشهد است.
صفحه 283:
* به همین ترتیب برای واریته گندم که شامل چهار رقم فلات؛ روشن. سرداری و گاسکوژن است: le
فلات به عنوان واریته پایه انتخاب شده و ارقام روشن؛ سرداری و گاسکوژن به وسیله متفیرهای کیفی
550337 : طقط1805 و هه زمكاكة6 وارد الكو شده است. مدل های کمباین شامل جاندیر و سهند
06 است کهبه وسیله یک متفیر کیفی با نام ۷10061 وارد الگو شده است. مقدار یک نشان دهنده
استفاده از کمبلین جاندیر و مقدار صفر نشان دهنده کمبلین 500) است. نوع کشت شامل دو وضیت
آبی و دیم است که به وسیله متفیر ۸30637۳0 مشعص شده است مقدار یک نشان دهنده کشت یی و
مقدار صفر نشان دهنده کشت دیم است.
* به این ترتیب متفیرهای مستقل کیفی شامل منطقه؛ واريته كندم؛ نوع كشت و مدل كمباين وارد الگو
مىشوندء ساير متغيرها شامل عمر كمبلين؛ تاریخ برداشت و ساعت برداشت متفیرهای کمی هستند که به
ترتیب با نام های ۰5۵21 Omr . Tarikh معرفی میشوند.
متفیر 0010۳ برحسب سال؛ متفیر 181116 برحسب شماره روز از ابتدای سال ۸۴ و متفیر ٩801 برحسب
فاصله زمانی از ساعت ۱۲ شب که مقداری بین صفر تا یک می باشد در نظر گرفته شده است.
معنیداری کلی رگرسیونی با استفاده از آزمون ۳ و معنی داری ضرایب با استفاده از آزمون ! بررسی میشود.
صفحه 284:
رگرسیون بر روی متغیر وابستةٌ موهومی
* در مدلهای رگرسیونی دارای متفیر موهومیء این فرض ضمنی وجود داشت كه
متغیرهای توضیحی میتوانند کمی» کیفی یا ترکیبی از آن دو باشند. در حالیکه
متغیر به هر حال بایستی قابل اندازه گیری کمی باشد.
* در این قسمت مدلهای رگرسیونی مورد نظر قرار میگیرند که در آنها متفیر
وابسته یا تلبع: خود ماهیتاً بیانگر دو گروه است که هر یک مقادیر ۰ و ۱ را اختیار
میکنند.
صفحه 285:
WN
:عموما برای تخمین این مدلها سه روش وجود دارد
linear probability model (LPM) (b+ مدل احتمال .١
؟. مدل لاجيت (00116.آ)
(Probit) مدل پروبیت .*
صفحه 286:
مدلهای معادلات همزمان
صفحه 287:
بسيارى از رولبط آمارى .به وسيلة مدلهای تک معادلهای قلبل تبیین هستند. در
لین مدلها يك متغير (متغير وابسته) به عنوان تابعى خطى ازيك بیا چند متفیر
ديكر (متغيرهاى توضيحى) درنظر كرفته مىشوند..به لين ترتيب.به طور ضمنى
فرض بر لين است كه رابطة على (درصورت وجود بين دو متغير > و /ا يكطرفه
میباشد یعنی متفیرهای توضیحی حکم علت و متغیر وابسته حکم معلول را دارا
میباشد.
asia Ul وجود دارد iS جريلتى دوطیفه از رابطة على يين متغيرها مواجهيم
یعنی ییک متفیر در عين تأثي ركذارى بر متفیر(های) دیگر از كن (آنها) نيز
تأثیر میپذیرد. بدیهی است در این حالت: تحلیل ركرسيونى قبل (CLE) براق
مطالعة چنین وضعی مناسب نخواهد بود جرا كه دو متغير متقابلاً بهم وابستهاند. به
عبارت دیگر در لین حللت به دو معادله احتياج خواهیم داشت و همین ضرورت
است که ما را متوجه مبحث معادلات همزمان می کند.
صفحه 288:
اگر در لین حللت از سایر معادلات در سیستم چشمپوشی نماییم و
پارامترهای هر معادله رابه وسیلة روشی مانند حدلقل مربعات معمولی
تخمین بزنیم» این تخمینها نه تنها تورشدار بلکه ناساز گار نیز خواهند
بود چون یکی از فروض قاطع روش OLS « داشتن توزیع مستقل
متغیرهای توضیحی از جزء اخلال استو کاستیک است که در معادلات
همزمان نقض میشود.
در این حالت از روشهای زیر استفاده میشود:
- روش حداقل مربعات دو مرحله (251)
- روش حداقل مربعات سهمرحلهای (351.5)
— روش حداقل مربعات سه مرحلهای تکراری (1351,5)
< روش حداکثر راستنمایی
* روش حداکثر راستنمایی با اطلاعات محدود (11)
* روش سیستمی حداکثر راستنمایی با اطلاعات CFIML) pis
صفحه 289:
در حوزهٌ مطالعات اجتماعی و اقتصادی؛ روشهای تحلیل چندمتفیرة زیادی وجود
دارند که به بررسی اثرات و روابط بین متغیرهای مورد مطالعه میپردازند.
این روشها عمدتا اثرات مستقیم یک متغیر بر متفیر دیگر را مورد بررسی قرار
میدهد.
اما در این میان تحلیل مسیر از جمله تکنیکهای چندمتغیره است که علاوه بر
بررسی اثرات مستقیم متفیرهای مستقل بر متفسر وابسته؛ اثرات غيرمستقيم اين
متغيرها را نیز مدنظر قرار میدهد و روابط بین متغیرها را مطابق با واقعیتهای
موجود در تحلیل وارد میکند و با بیان منطقی: روابط و همبستگی مشاهدهشدةٌ
بين آنها را تفسير مى كند.
صفحه 290:
خاستگاه تحلیل مسیر
abl dew sf Geel Oright bos °
Corwuhted ta sertes oP pupers published in dd,
4990, 996, 0
© برای استخراج اثرات مستقیم و غیرمستقيم در بین متغیرها
ایجاد شد.
٠ تحليل مسير با ارتباطات تبعی در پین متفیرها سرو کار دارد.
صفحه 291:
اصل اساسی موردنظر در تحلیل مسیر این است که هر ضریب همبستگی
بین دو متغیر را میتوان به مجموعهای از مسیرها تجزیه کرد.
استفاده از تکنیک تحلیل مسیر مستلزم قبول پیشفرضی است مبنی بر
اينكه روابط بین متغیرهایی که حداقل در مقیاس شبهفاصلهای هستند به
طور خطی با افزایش متفیرها اضافه میگردد. هر متفیر وابسته بر اساس
اثرات متفیرهای قبلی در دیاگرام مسیر و متفیر باقیمانده مورد تحلیل و
تبيين قرار مى كيرد.
صفحه 292:
تجزیه همبستگی
* همبستگی - اثرات مستقیم + اثرات غیرمستقیم
صفحه 293:
برای ساختن یک مدل در بحث تحلیل مسیرء ده شرط مطرح شده است کهبه کمک آنهاء
امکان تجزیه و تحليل على فراهم مىكردد. درده شرط موردبحث هضت شرط اول مدل
تلوریکی مناسبی را برای تجزیه و تحلیل و استتاج le فراهم میسازد:
بیان رسمی تئوری در قالب مدل ساختاری
وجود منطق تئوریکی برای فرضيههاى علّى
معیننمودن نظم علی
مشخصنمودن جهت روابط de
نوشتن معادلات توابع
مشخصنمودن مرزهای مدل
ثبات مدل ساختاری
عملياتى كردن متغيرها
تأييد تجربى معادلات كا ركردى
۰ برازش مدل ساختاری با دادههای تجربی
مد 4 yd we جا از مد
صفحه 294:
درتحلیل مسیریبه منظور بررسی رولبط علت و معلیلی بین متغیرها لازم است برای عینی
شدن آنها و جلو گیری ازبروز اشتباهات» ازنمودارهای مسیری استفاده نمودکه این کار را
میتوان طی مراحل زیرنشان داد:
الف - تعیین متغفیرها: پیش از هرچیز باید هریک از متفیرهای مورد بررسی
به لحاظ نقشی که در سیستم ایفا مینماینده مشخص شده باشند. ازاين
نظر دو نوع متغیر وجوددارد:
متغیربرونزا: به متفیرهایی از مجموعة متغیرهای مورد بررسی اطلاق
مى كردد كه تحت تأثير ساير متغيرها قرار نداشته باشند.
متغیرهایدرونزا: به متغیرهایسی ازمجموعه متفیرهای موردبررسی اطلاق
میگردد که تحتتا ثیر یک یا چند متغیر دیگر قرارداشته باشند.
صفحه 295:
انواع مدلهای مسیری
در تحلیل مسیری با دو نوع مدل سرو کار داریم ST) ۱۳۸۰):
۱- مدلهای باز گشتی: به مدلهلیی گفته مى شود كه در بين هيح یک
از متغیرهای مورد بررسی, رابطةٌ دوطرفه پا متقلبل وجود نداشته
باشد.
۲- مدلهایغیر باز گشتی: یعنی مدلهلیی که در آنها رابطة بين برخى
ازمتغیرها به صورت دوطرفه باشد.
صفحه 296:
مدلهای مسیری باز گشتی
ارتباطات علی یکطرفه میباشند.
@®—-@—-@
eS
(وه)--- وهای
صفحه 297:
مدل غیرباز گشتی
ارتباطات علی دوطر فه هستند
0ك
Cx) ©)
> +
صفحه 298:
معنی مدلهای مسیری
s فرض بر این است که مدلهای مسیری نشاندهندهٌ فرضیههای
علی میباشند.
* یک مدل مسیری معنیدار به معنی علیت نمیباشد.
- بلکه با استفاده از دادههای تجربی از یک مدل برای آزمون علیت
استفاده نمود.
صفحه 299:
اثرات غير مستقيم و مستقیم
1 دو راهی که یک متفیر پیشبینی کننده ممکن است بر یک
منغير واكنش تأثير بكذارد.
* اول یک اثر مستقیم متفیر « بر روی متغیر ۷
xv
. دوم يك لذ یر ER Bl SY 09 i oe
اكنندة ديكر.
صفحه 300:
نمودا
ر مسیر درونداد در مطالعةٌ رضایت شغلی
59
ey
۳
Py
Py ايت شخ
صفحه 301:
ماتریس همیستگی
رضایت شغلی درآمد خودفرمانی درآمد
376
.733
35
1.000
627
374
1.000
35
280
1000
374
صفحه 302:
رضایت شغلی
Mean Square
22.854
317
MULTIPLE REGRESSION
Equation Number 1
Dependent Variable.
ntered on Step Number
Variable(s
1 درآمد
2. . خودفرماتی
Bs سن
Multiple R
R Square
Adjusted R Square
Standard Error
Regression
Residual
F = 72.083
Beta 1 Prob
AGS 6.213.000
0و5 9.492.000
-080 -1.099 75
832
دوم
683
563
Analysis of Variance
DF Sum of Squares
3 68.563
96 30.437
Prob = .000
B SEB
468 075
0 061
=080 073
Variable
ways
خودفرمانی
سن
صفحه 303:
* _بنابر آنچه گفته شد. بيكانها نشاندهندةٌ پیوندهای علی مورد انتظار بین متفیرهاست
اين مدل از جب به راست حركت مى كند تا از حجيت على متغيرهائى را كه به جب
نزدیک تر هستند را منعکس سازد؛ هر معرف نماد یک مسیر علی و بنابراین یک
ضریپ قير أبنت كه باید محاسبه شود.
بر بايه ابن مدل ملاحظه مى كنيم که:
- سن بر رضايت شغلى هم اثر مستقيم (80) ) و هم اثر غيرمستقيم دارد.
- سن به كونه مستقيم بر درآمد اثر مىكذارد (©8) كه به نوبه خود در رضايت اثر دارد
PO) و بر خردفرعلی نيز اثر مي كذارد (6۳62) که خود بر در آمداثر مستقیمدارد( @
و به نوبه خود رضایت را زیر نفوذ قرار مىدهد (©6).
- علاوه براینه خودفرمانی نیز بر رضایت شغلي هم اثر مستقیم (6۳6): هم از طریق تأثیر بر
درآمد (805)) بر آن اثر غير 0 ١
- سرانجام در آمد بر رضايت اثر مستقيم دارد (©6) اما بر آن اثر غيرمستقيم ندارد.
صفحه 304:
مشاهده میشود کوردرآمده dla bape و رضلیت شنا
۱
آن متفيرهاست كه مستقيم به آنها وصل شدائد
لين بيكانها معرف واريلنس تبيين نشده براى هر متغير
میباشند
بتابرلين بيكان تبه خودفرملنى (820) بياتكر مقدار
واریانس خوذفرمانی است که از سوی سنن» تین
نمیشود
پیکان ©صبه رضليت شفلى (©)) معرف مقدارى از
شغلی است که از سوى سن»
آمد توجیه نمیشود.
سرانجام پیکان 6 عبه درآمد (06) معرف مقداری
از واریلنس در آمد است که از سوی سن و خودفرمانی
تين تله اسح
ابن سه جملة خطا نشاندهندةٌ ابن واقعيت است كه
متفیرهای دیگری وجود دارند که بر خودفرمانی و
درآمد و رضابت شغلی اثر دارند اما در این نمودار
هسیر گنجانده نشده اس
صفحه 305:
تحليل مسير اساساً با بر آورد مقدار اتصالات پین متفیرها و کاربرد این بر آوردها به منظور بدست
آوردن اطلاعاتی دربارٌ فرایندهای علی زير:
هرچند این برآوردها را میتوان از طریق روشهای گوناگونی بدست آورد اما سادهترین راه برای
محاسبة آنهاء كاربرد روش ركرسيون معمولی است
مشروط بر آسن كه مفروضدهاى ركرسيون بهويزه اين مفروضه كه متغيير يس.ماند در معادلة
ساختاری با متغیرهای تبیین کننده در آن معادله ناهمبسته است برقرار باشد
برای بدست آوردن برآوردهای ضرائب اصلی مسیر کافی است هر متفیر وابسته (درونزا) به
متغیرهائی که مستقیماً تحت تأثیر آن است بازگشت داده شود. به بیان دیگر برای بر آوردهای هر
یک از مسیرهای مشخعص شده. ضرائب استانداردشده رگرسیون (یا ضرائب مسیر) محاسبه میشود.
این ضرائب از طریق برقراری معادلههای ساختاری یعنی معادلههائی که ساختار روابط مفروض در
ائی سرو کار دارد.
یک مدل را مشخص مىسازد به دست مى 1 ب
صفحه 306:
ب. برای نمودار مسیر شکل لازم است سه معادله ساختاری» یکی برای
خودفرمانی؛ یکی برای رضایت شغلی و یکی برای درآمد (هر یک به عنوان متفیر
وابسته و متفیرهائی که در معادله آمده به عنوان متفیر وابسته) محاسبه شود.
Gin A < خودفرملنی
© انك + (درآمد) ن»+ (خودفرملنىع ن»<+ (سيى ,< - يضليتشغلى
aT pam GH) +x (des)+ eg ©
صفحه 307:
40
رآمد) ریک + (خودفرملني) + fH) لي
+ (خودفرملئي) UT =m Gn) +m
ضریب استاندارد برای سن در معادله (۱) مقدار ای: ضرائب سن؛ خودفرمانی و درآمد در معادله (۲) به
ترتیب مقادیر ۳و ۰ طوو و؛ و سرانجام ضرائب سن و خودفرمانی در معادله (۳) به ترتیب
مقادیر "اي ور رابه دست می دهد. بنابراین به منظور محاسبه ضرایب مسی ضرورت دارد سه
معادله را به عنوان معادلههای ر گرسیون چندمتفیری در نظر بگیریم و ضرائب حاصل از آنها ضرائب
سیر را بدست میدهد..
صفحه 308:
* . از مقادیر عرض از مبدأ در هر مورد صرفنظر و سه جمله
خطا از طريق ريشه دوم 7۳ -عاسبه میشود.
* بايد توجه داشت كه جون به منظور تكميل مسيرها لازم است
همه ضرائب مسير محاسبه شود بنابراين نبايد از روش
ركرسيون كام به كام استفاده شود.
صفحه 309:
Analysis of Variance
DF Sum of Squares. Mean Square
Regression 2 43.150 21.575
Residual 9 55.850 516
F= 37471 Prob = 000
— Variables in the Equation
Variable Bo OSEB سيم T Prob
مود كله 79م كلك خودفرمانی 008
0 ترد م 9 70د شن
(Constant) 00 00 0
برای مثال» بر پایه تحلیل رگرسیون معادله سوم ضرايب استانداردشده براى خودفرمانى
با ۰,۴۳۱ است,
برابربا ۰,۲۱۵ و ۰,۵۱۷ و مقدار ۸۲
aoe
برای ۰0۴ 9۵ و 94 در نمودار مسیر خواهیم داشت:
7۴-۰۵ py =9/ OW pa VV 2 FRI =0/¥O
صفحه 310:
صفحه 311:
چون ضرلیب مسیر ضرلیب استاندارد
هستند» لین امکان وجود دارد که آنها
رابه گین؛ مستقیم با هم مقایسه کنیم.
میتوان دید که سن اثر مستقیم اما
بسیار کوچک و منفی در رضایت
شغلی دارد در حالیکه لشر غیرمستقیم
آن مثبت و قابل توجه است.
صفحه 312:
بسیاری از پژوهشگران مایلند لثر کلی یک متفیر را بر متفیر دیگر محاسبه کنند برای
مثال لثر كلي سن بر رضليت شغلى از طربيق جمع لثر مستقيم Ne) -) با مجموع آثار
غيرمستقيم آن.به دست میآید. آثار غیرمستقیم آز طرییق حاصلضرب ضرلئب هر مسی
سن به رضایت شغلی به طریق زیر محاسبه میشود:
برای مسیرهای سن به درآمد به رضایت شغلی ۲۷/۰ - (۴۷/۰ *۵۷/۰)
پرای مسیرهای سن به خودفرمانی به رضایت شغلی ۱۶/۰ < (۵۸/۰ * ۲۸/۰)
برای مسیرهای سن به خودفرمانی به درآمد به رضایت شعلی ۰۳/۰ - (۲۷/۰ ۲۲/۰۶ ۲۸/۰)
اين جمع آثار عیرمستقیم سن بر رضایت شغلی ۲۶/۰ - ۰۳/۰ + ۱۶/۰ + ۲۷/۰ میباشد.
و براى لثر كلى سن بر رضليت شغلى بليد لثر مستقيم لَن راجا كل آثار غيرمستقيم ن جمع کنیم که
حاصل آن برابر با ١8/٠ + ؟ع/٠ - 58/٠ - خواهد بود.
لين تمرين نشان داد كه لثر غيرمستقيم سن بر وضليت هماهتك .با لثر مستقيم
آن نزديك به صفر و اثر غيرمستقيم آن مثبت است.
صفحه 313:
خودفرمانی
ماهیت کار
صفحه 314:
برعل ارقاح بهت عل ين مبدمصيريها راادز تمودار متیر جمیتوآن:ج
در شکل مشاهده میشود خودفرمانی و ماهیت کار همبستهانده یعنی
دیگری وجود ندارد: و اتضال بین آنها به وسیله یک پیکان دوسره نشان داده شده است. هر متفیر
دارای یک لثر مستقیم (۳6) و ۳6۴), ویک لثر غیرمستقیم بر غیبت از طریق رضلیت شفلی است:
خودفرمانی به رضایت (۳0))
و رضلیت به غیبت (۳60))؛ ماهیت کاربه رضلیت (4*6) و رضلیت به غیبت (6*).به منظور
ضرلیب
محاسبه ضرلیب لازم؛ نیز به ضریب ۲ پیرسون برای خودفرمانی و ماهیت کار و نیز :
استانداردشده دو معادله زیر داریم:
my LEAL) + By (خودفرملنی) 5 + ,ده یضلیت
ج9 + (یضلیکن»< + (ماهیتکار) رد + (خودفرملنی) ,6< « غیبت
صفحه 315:
پس از لن میتوانیم کل آثار علی را هم برای متفیرهای خودفرمانی و
ماهیت کار؛ و هم برای رضلیت محاسبه وبا هم مقایسه کنیم. لثر کلی هر
تولند از جمع لثر مستقیم.با کل آثار غیرمستقیم تشکیل شود. اثر کلی لین
سه متفیر بر غیبت عبارت است از:
(,0,()0) +(,0) - اثر کلی خودفرمانی
(,0:()0) +(,0) -اثر کلی ماهیت کار
,0- اثر کلی رضایت شغلی
صفحه 316:
مدل غیربا زگشتی
KD
صفحه 317:
> تفسیر ارتباطات
- ولابازگشتیو علیولبسته بسه چد میساشد
- وا ممکزلستده طور غیرمستقیم از طریقمبه م8 ولبسته باشد
- م0 سمکزاستبسه طور غیرمستقیم از طریق, به م8 ولبسته باشد
| مع ممکزلستسه جع ولبسته بساشاء
* اگر این وضعیت وجود داشته باشد ...
- فروض )ما نقض میشوند. در رگرسیون به روش 2 فرض بر ايت
است که ارتباطات یکطرفه بوده و جملات خطا از یکدیگر مستقل میباشند.
صفحه 318:
در اینحالت باید از روش ,060 یا روش حداقل مربعات
دومر حلهای استفاده نمود.
صفحه 319:
تحلیل عاملی
Puvtor Oualsis
صفحه 320:
تحلیل عاملی از تعدادی فنون آماری تر کیب شده و هدف آن
ساده تر کردن مجموعههای پیچيده دادههاست
صفحه 321:
5
111
1
cd
7
۸
TN
2/۳
“Ok
oA
504
2/۳۳
3
1۳۸
۸
7۵
geet همبستگی مجموعهای از ضرایب
تعدادی از متفیرها است:
AN فرض بر لین است که هر متفیر یا خودش
همیستگی کامل دارد(عناصری که در
83 2 | 581 | همبستگی ری ار 0 we
& در فهم و تفسیر تحلیلهای عاملی مهم
ف ۷ اه اهستيد).
ae ne | 2 زواید زیادی در ماتریس وجود دارد؛ بدين
مت سوه ما که هر شریپ دوبار در ماتریس
eee 2 ie
pase ay yoo Jue
i 57 7 2/41 املی برای کر ~~
صفحه 322:
تعریف عاهل: اساساً علمل. بعد یا سازهای است که
رولبط بین مجموعهای
مطرح میکند پنابه عقیدٌ رویس NET) عامل»
سازهای است که عملاً از روی (یا بوسیلذ) بارهای
رها رابه صورت خلاصه
عاملیاش تعریف میشود.
تعریف بارهای عاملی: همبستگی میک متفیربا ب
عامل را بار عاملی گویند. فرض کنید کجموعهای از
آزمونهای توانلیی و پیشرفت تحصیلی را تحلیل
عاملی کردهايم. لین مثال؛ سه علمل را در یک نوع
تحلیل عاملی از تواناییها نشان میدهد. عاملهای
ی نیز ممکن است وجود داشته باشد لما اینها
ماهیت عوامل و بارهای عاملی را بهتر توضیح
فى ده
فرانسه
عامل ۱
۸/۰
۷۸/۰
۳/۰
۷۵/۰
1۹/۰
عامل ؟
۶2۳/۰
role
2/۰
۶۸/۰
1۳/۰
Me
عامل۳
1۹/۰
ave
۳/۳۰
Wie
۱/۰
Bele
صفحه 323:
فایده تحلیل عاملی
pes 8 اینکه میدانيم تحلیل عاملی برای خلاصه کردن ماتریسهای
همپستگیبه یه کار برده میشود» هنوزبیک موال مهم بلقی است و آن این
است که با تحلیل عاملی چه کارهلیی را میتوان انجام داد و لین فن
چگونه میتواند سودمند واقع گردد؟
* برای پاسخبه لین پرسش, بلیدبه لین نکته توجه کرد که هنگام کاربرد
اين روش بايد بين تحليل weet » (exploratory) gles!
»ls (confirmatory) قائل شد.
صفحه 324:
تحلیل عاملی اکتشافی: یک مثال
هدف از تحلیل عاملی ALES بررسی يك حوزه (8610) براى كشف ابعاد یا سازههای اصلی آن
حوزه است.به همین علت بود که اسپیرمن )۱٩۰۲( تحلیل عاملی را در حوزه توانیبهای انسان بوجود
آورد. او سعى كرد به اين سؤال كه جرا بين توانایبهای انسان هميشه همبستگی مثبتی وجود دارد پاسخ
دهد. (در تحلیل عاملی توانایهاء لین موضوع صورتبندی مثبت نامیده میشود بلین معنا که تمام
هتبتك فاق Sul et Seah ei ale
به طور کلی در تحلیل عاملی اکتشافی» قاعده بر این است که محققان تا حدامکان متغیرهای بسیاری را
وارد تحلیل کنند تا پینند کدام یک از آنها روی عامل موردنظر بار عاملی دارند
صفحه 325:
تحلیل عاملی تأییدی
* در ابتدا تحلیل عاملی صرفًیک روش آماری اکتشلفی بود لما اخیراً این امکان بوجود
آمده که جا استفاده از تحلیل عاملی؛ فرض آزملیی کرد. لین روش كه بوسيلة يورس
کوگ (۱۹۲۳) ابداع شده؛ تحلیل تأییدی نامیده میشود.
صفحه 326:
اشکالات وارده بر تحلیل عاملی
ايراد اصلى وارد بر تحلیل عاملی این است که بینهایت راه حل
ریاضی معادل وجود دارد.
تحلیل گران عاملی غاباً در تعیین مهمترین علامتهای یک
حوزه با هم اختلاف دارند.
تکرار تحلیلهای عاملی دشوار است.
صفحه 327:
انجام تحلیل عاملی
یکی از آمارههایی که محقق از طریق آن قادر به تعیین و
تشخیص مناسببودن دادهها برای تحلیل عاملی میباشد. آزمون
0 میباشد که مقدار آن همواره بین ۰ و ۱ درنوسان است.
درصورتیکه مقدار 110 کمتر از ۵/۰ باشد؛ chy Wools تحلیل
عاملی مناسب نخواهند بود. اگرمقدار آّن بین ۱۵/۰ ۶۹/۰ باشد.
میتوان با احتیاط بیشتری به تحلیل عاملی پرداخت. اما
درصورتیکه مقدار آسن بزرگتر از ۷/۰ باشد» همبستگیهای
موجود در بین دادهها برای تحلیلعاملی مناسب خواهند بود.
Kaiser-Meyer-Olkin ¢
صفحه 328:
دررابطه با حجم نمونه نيز بليد تأكيد كرد كه تعداد نمونه نبليد كمتر از a
مورد باشد و ترجيحاً حجم نمونه را بليدبه بيش از ٠ مورد افزليش داد.
اولين تصميم در بكار كيرى تحليل عاملى؛ ؛ محاسبة هاتريس هميستكى
است. برای اینکار بلید مشخص شود كه یا هدف. محاسبة همبستكى بين
متغیرهاست یا بین پاسخگویان اگر هدف مطالعه تلخیص متفیرها باشد.
Z
در لین صورت بلید همبستگی بین متغیرها محاسبه شود. لین روش یکی
از تکنیکهای عمومی و پر کاربرد در مطالعات میباشد کهبه تحلیل عاملی
نوع *) معروف است.
صفحه 329:
در تحلیل عاملی مدلهای مختلفی وجود دارد
كه از ميان آنها دو روش
- تحليل مؤلفههاى اصلى
- و تحليل عاملى مشترك
از يركاربردترين اين روشهاست.
مدل تحلیل مژلفههای اصلی زمانی مورد استفاده قرار میگیرد؛ که
هدف محقق تلخیص متغیرها و دستیابی به تعداد محدودی عامل برای
اهداف پیشبینی باشد.