آشنایی با آمار توصیفی
اسلاید 1: آشنايی با آمار توصيفيارائه دهنده: مسعود مكاريان زير نظر استاد: سركار خانم غزنويرشته: مهندسي عمرانواحد كاشمر
اسلاید 2: پيشگفتار:در عصر حاضر كسي نميتواند منكر این واقعیت باشد كه آمار نقشي لاینفک در زندگي روزمره ما بازي ميكند. اخبار روزانه رسانههاي گروهی با گزارشی از وضع هوا به پایان ميرسندو در طول اخبار، به جریانهای بازار بورس و سهام اشاره ميشود و روزنامهها خبر از افزایش نرخ اجناس ميدهندو...آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمينههاي علمي از جمله جامعه شناسي، کشاورزی، فيزيك و....به كار گرفته ميشود. در دانش امروزي، معمولا سعی ميشود كه اطلاعات موجود در يك زمينه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به دست آمده و امکان مقایسه فراهم گردد. در يك جمله آمار مجموعهاي از روشهای جمع آوری، تهيه وتنظیم و تجزیه و تحلیل اطلاعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته ميشود.
اسلاید 3: فهرست مطالب:آمار توصيفيجدولهاي آمارينمودارهاي آماريمعيارهاي مركزيمعيارهاي پراكندگيمنحنيهاي فراواني
اسلاید 4: آمار توصيفي:براي اينكه نتايج مناسب و مطلوب از اطلاعات كه در آمار گيريها جمع آوري ميكنيم، به دست آيد بايد:اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشندبه نحو مفيدي تهيه و تنظيم شوندبه نحو صحيح تجزيه و تحليل گردندقابل نتيجه گيري صحيح باشندبه طور كلي، روشهايي را كه به وسيله آنها ميتوان اطلاعات جمع آوري شده را تنظيم كرده و خلاصه نمود، آمار توصيفي ميناميم و در يك كلام آمار توصيفي عبارت از مجموعه روشهايي است كه پردازش دادهها را فراهم ميسازد. اطلاع از اصطلاحات زير در آمار ضروري است.آمار توصیفی:
اسلاید 5: مجموعه افراد يا اشيايي را كه ميخواهيم يك يا چند خصوصيت مشترك آنها را مورد بررسی قرار دهيم، جمعيت يا جمعيت آماري ميناميم.اندازه قد يا وزن دانشجويان بيست ساله يك شهر، تعداد لامپهاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، مثالهايي از جمعيتهاي آماري هستند.مثال:دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيتمعمولا مطالعه ويژگيهاي مورد نظر، به هنگامی كه جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زيادي ميباشد و در بسیاری از مواقع، اين امر اصولا امکان پذیر نیست. بنابراین در چنین موردی، براي مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا ميكنيم.نكته:آمار توصيفي:
اسلاید 6: آمار توصيفي:قسمتي از جمعيت را كه طبق قاعده و ضوابط خاصي، براي مطالعه خصوصيتي از جمعيت انتخاب ميشود، يك نمونه از جمعيت ميناميم.نمونهدادهمقياسهاي اندازهگيرينمونهمتغيرجمعيتاين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد. با توجه به اهميت اين موضوع شاخهاي از آمار تحت عنوان نظريه نمونهگيري با بررسي نمونهاي به اين امر مهم ميپردازد. در بسياري از موارد، معمولا نمونه تصادفي ساده را در نظر ميگيرند. نکتهبراي بررسی اندازه قد دانشجویان بیست ساله يك شهر، انتخاب مثلا 150 نفر از بین اين جمعیت به طور تصادفی، يا انتخاب 100 لامپ به تصادف از لامپهاي توليدي يك کارخانه در يك روز معین، براي تعيين كيفيت لامپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند.مثال:
اسلاید 7: آمار توصيفي:خصوصیت مورد مطالعه، از فردی به فرد دیگر، يا از شي به شي دیگر در جمعیت آماری تغيير ميكند، كه آن را اصطلاحا متغير ميناميم.معمولا دو نوع متغير در آمار مورد نظر هستند: متغيرهاي گروهي، نظير رنگ، نژاد، شغل و گروه خوني كه شامل چند گروه يا طبقه ميباشند.متغيرهاي عددي كه ممكن است نتيجه شمارش باشد، مانند تعداد احشام هر خانوار در يك روستا،تعداد حوادث در يك كارخانه در روزهاي مختلف، و يا نتيجه اندازهگيري باشد، مثل قد دانشجويان بيست ساله در يك شهر، حجم شربت مولتي ويتامين با استاندارد خاص.دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 8: آمار توصيفي:متغير:متغيرهاي گسستهمتغيرهاي پیوستهمتغيرهاي گروهيمتغيرهاي عددي كه از راه شمارش بهدست آمده اند متغيرهايي را كه از طريق اندازهگيري به دست آمده باشنددادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 9: آمار توصيفي:در بسیار از مسائل پيشرو، اندازهگيري ویژگی يك متغیر مستلزم آگاهی و شناخت خاصي است. به طور كلي چهار نوع مقیاس براي اندازه گيري وجود دارد:مقياس اسميمقياس ترتيبيمقياس فاصلهايمقياس نسبتيدادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 10: آمار توصيفي:اين نوع مقياس اندازهگيري عمدتا براي طبقه بندي دادهها به كار ميرود و منظور از آن اتلاق يك عدد طبيعي به دادههاي متفاوت است. اختصاص اعداد 1 تا 4 به گروههاي خوني A,B, AB, O.مقياس اسمي:مثال:اين اعداد را نميتوان براي مقايسه يا چهار عمل اصلي به كار بردتوجه داشته باشيد كه:دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 11: آمار توصيفي:مقياس ترتيبي:اين نوع مقياس اندازهگيري عموما براي طبقه بندي دادهها به منظور يك نوع برتري به كار ميرود. در يك كارخانه ممكن است كارگران را به سه دسته ساده، نيمه ماهر و ماهر تقسيم بندي كنيم. اتلاق به ترتيب اعداد 1 تا 3 به اين سه دسته يك مقياس ترتيبي است.مثال:اين اعداد تنها براي مقايسه به كار ميروند و نميتوان با آنها چهار عمل اصلي را انجام داد.توجه داشته باشيد كه:دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 12: آمار توصيفي:اين نوع مقياس اندارزهگيري عموما در زمينههاي كه علاوه بر حفظ ترتيب به نحوي فاصله بين ويژگيها را نيز حفظ ميكند. به عبارت ديگر در چنين مقياسي نسبت تفاضلها ثابت ميماند.مقياس فاصله اي:اندازهگيري ضريب هوشي دانش آموزان كلاس اول دبستان در شهر اصفهان.مثال:در اين نوع مقياس، عدد صفر يك مفهوم قراردادي است.توجه داشته باشيد كه:دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 13: آمار توصيفي:اين نوع مقياس اندازهگيري علاوه بر حفظ فاصله، نسبت را نيز حفظ ميكند. به عبارت ديگر در اين نوع اندازهگيري نسبت دو مقدار بستگي به واحد اندازهگيري ندارد. مقياس نسبتي:دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 14: آمار توصيفي:اطلاعاتي كه از مطالعه يك متغير به دست ميآيند، معمولا شامل انبوهي عدد يا علامت ميباشند كه آنها را داده ميناميم. دادهها را نسبت به نوع متغيري كه اندازه گيري ميكنيم به دو دسته داده گسسته و دادههاي پيوسته تقسيم ميكنيم.معمولا به دادههاي جمع آوري شده كه انبوهي عدد است و هيچ نوع پردازشی روي آنها انجام نشده است داده خام ميگويند.داده خامدادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 15: آمار توصيفي:مواردي كه در ارتباط با يك مجموعه از دادههاي ميبايستي مد نظر قرار داد،عبارتاند از:خلاصه كردن و توضيح دادهها به وسيله تنظيم جداول و رسم نمودارها. محاسبه مقادير عددي، براي دست يافتن به معيارهايي كه تمركز و يا پراكندگي دادهها را نشان دهد.در آمار،براي اينكه از دادههاي خام واقعيتهاي موجود را استخراج كنيم،آنها را به نحوي مناسب دستهبندي كرده و جدولهايي به نام جدولهاي آماري تهيه مينماييم. متداولترين جدول در آمار، جدول فراواني است.پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم،اطلاع از اصطلاحات زير ضروري است.دادهمقياسهاي اندازهگيرينمونهمتغيرجمعيت
اسلاید 16: جدولهاي آماري:هرگاه داده از نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند،آنگاه را فراواني ميگوييم. به عبارت ديگر تعداد دفعاتي را كه در دادههاي تكرار ميشود، فراواني ميناميم و آن را با نماد نمايش ميدهيم.به خاطر داشته باشيد كهاگر اندازه نمونه برابر باشد، آنگاه براي فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني
اسلاید 17: جدولهاي آماري:مثال:دادههاي زير ميزان تصادف منجر به مرگ رد 30 منطقه را نشان ميدهد. فراواني دادها را تعيين نماييد.7 6 6 3 4 3 5 5 6 83 4 8 4 7 5 8 5 5 36 5 5 6 6 5 6 7 8 2مشاهده ميشود كه دادههاي تكرار اعداد 2،3،4،5،6،7،8 ميباشند،بنابراين جدول زير را براي فراواني دادهها خواهيم داشت:2 3456781438734فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني 31232119
اسلاید 18: جدولهاي آماري:نسبت فراواني به اندازه نمونه را فراواني نسبي ميناميم. اگر فراواني در يك نمونه با اندازه n ، برابر باشد، آنگاه فراواني نسبي را با نماد نمايش خواهيم داد، به طوري كه:به خاطر داشته باشيد كهبراي فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني
اسلاید 19: جدولهاي آماري:2 3456782 34567814387340.0330.1330.1000.2670.2330.1000.133فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني 17
اسلاید 20: جدولهاي آماري:با توجه به تعريف فراواني، فراواني تجمعي رديف i را با نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم:به خاطر داشته باشيد كهبراي اندازه نمونه n و آنگاهفراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني
اسلاید 21: جدولهاي آماري:2 3456782 345678143873415816232630فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني 17
اسلاید 22: جدولهاي آماري:با توجه به تعريف فراواني نسبي، فراواني نسبي تجمعي رديف iرا با نماد نماد نمايش ميدهيم و به صورت زير تعريف ميكنيم:به خاطر داشته باشيد كهبراي اندازه نمونه n و آنگاهفراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني
اسلاید 23: جدولهاي آماري:2 345678فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني 17
اسلاید 24: جدولهاي آماري:معدل 50 دانشجوي دانشگاه با تقريب تا يك رقم اعشار، به شرح زير است:1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/24/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1مثال:چون دادهها تا يك رقم اعشار گرد شدهاند، بنابراين ميتوان گفت كه اندازه واقعي معدلها در فاصله[1/35,2/95]فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني تشکیل جدول فراوانی برای داده های پیوستهتعداد ارقام گرد شده31
اسلاید 25: جدولهاي آماري:فراواني نسبي تجمعيفراواني تجمعيفراواني نسبيفراواني كلاس55/1_35/175/1_55/195/1_75/115/2_95/135/2_15/255/2_35/275/2_55/295/2_75/2جمع45/165/185/105/225/22/4565/285/24612986235008/012/024/018/016/012/004/006/000/1410223139454750_08/020/044/062/078/090/094/000/1_تعداد طبقات2729
اسلاید 26: نمودارهاي آماري:معمولا دادهها را با نمودارهاي مختلف نمايش ميدهند. عموما اين نمودارها در ارتباط با دادههاي پيو.سته به كار گرفته مي شود و منظور از نمايش آنها، تجسم عيني اطلاعات نهفته در دادهها است. در اين بخش به معرفي چند نمودار معروف اكتفا ميكنيم: هيستوگرامچندبر فراوانيچندبر فراواني تجمعيمنحنيهاي فراواني و فراواني تجمعينمايش نمودار تنه و شاخهنمودار جعبهاي
اسلاید 27: نمودارهاي آماري:منحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه35/155/175/195/135/215/255/275/295/224/012/004/0مركز هر مستطيل نماينده كلاسعرض مستطيل برابر طول واقعي كلاسارتفاع هر مستطيل برابر فراواني نسبي15/115/325
اسلاید 28: نمودارهاي آماري:35/155/175/195/135/215/255/275/295/295/224/012/004/025/105/3منحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه
اسلاید 29: نمودارهاي آماري:35/155/175/195/135/215/255/275/295/295/244/02/008/025/105/362/078/090/094/000/1منحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخهاز اتصال نقاطي كه طول آنها مرز كلاس و عرض آنها فراواني نسبي تجمعي تا آن مرز باشد، يك خط شكسته به دست ميآيد كه آن را چندبر فراواني تجمعي مينامند25
اسلاید 30: نمودارهاي آماري:1نمودار منحني فراوانينمودار منحني فراواني تجمعيمنحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه
اسلاید 31: نمودارهاي آماري:2 345678*******************************4/15/16/17/18/19/10/2½2/23/24/25/26/27/28/29/2**************************************************فراوانيمنحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه
اسلاید 32: نمودارهاي آماري:نمرات 80 دانشجو در امتحانات نهايي درس احتمال و آمار به شرح زير است:93 76 88 62 90 68 82 75 84 68 75 85 59 71 93 60 73 88 79 73 72 63 78 95 62 74 87 75 65 61 60 68 74 69 77 94 75 82 78 6671 83 79 60 95 75 61 89 78 99 75 71 65 76 85 78 97 67 62 79 74 50 76 62 78 88 57 73 80 65 77 85 75 76 63 72 81 73 67 860 9 70 8 3 5 2 0 9 2 3 2 0 8 1 7 7 2 5 5 6 1 87 4 5 1 2 5 1 6 5 6 9 4 8 6 6 1 8 7 2 8 5 4 5 3 3 3 5 5 8 8 9 9 5 3 5 8 5 8 1 7 2 9 2 8 0 4 63 5 5 3 0 4 7 9 56789تنهشاخهمنحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه
اسلاید 33: نمودارهاي آماري:پس از ساختن نمودار اوليه معمولا بهتر است مقادير هر شاخه را از كوچك به بزرگ، با تعداد دفعات تكرار،مرتب كرد، به صورت زير:9 7 09 8 8 7 6 5 5 5 3 3 2 2 2 2 1 1 0 0 09 9 9 8 8 8 8 8 7 7 6 6 6 6 5 5 5 5 5 5 5 4 4 4 3 3 3 3 2 2 1 1 1 9 8 8 8 7 6 5 5 5 4 3 2 2 1 0 9 7 5 5 4 3 3 056789منحنيهاي فراواني و.....چندبر فراواني تجمعيچندبر فراوانيهيستوگرام نمايش نمودار تنه و شاخه
اسلاید 34: معيارهاي مركزي:با استفاده از جدول فراواني و رسم نمودارها ميتوانيم دادهها را به نحو مطلوبي تنظيم كرده و اطلاعات نهفته را تا حدودي مشخص كنيم. با اين حال براي ارايه يك گزارش مناسب،بهتر است آنها را در يك يا چند عدد مناسب نيز خلاصه كنيم. چنين عددي ميتواند معيار مركزي باشد. مهمترين معيارهاي مركزي ميانگين، ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت.هرگاه داده از نوع ، با فرض ، به ترتيب با تعدادهاي تشكيل شده باشند، آنگاه را فراواني ميگوييم. نماچندكهاميانهميانگين
اسلاید 35: اگر دادهها را از كوچك به بزرگ مرتب نماييم،عدد mرا ميانه اين دادهها ميناميم،اگر نصف دادهها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيردمحاسبه ميانه براي دادههاي گسستهفرض كنيد دادههاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم آنگاهM=اگر nفرد باشداگر n زوج باشدمعيارهاي مركزي:نماچندكهاميانهميانگين
اسلاید 36: محاسبه ميانه براي دادههاي پيوستهكلاس55/1_35/175/1_55/195/1_75/115/2_95/135/2_15/255/2_35/275/2_55/295/2_75/2جمع45/165/185/105/225/22/4565/285/246129862350410223139454750_طول هر ردهمعيارهاي مركزي:نماچندكهاميانهميانگين
اسلاید 37: چندك يك معيار كليتر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر ميگيرد. اگر pيك عدد حقيقي بين صفر و يك باشد،آنگاه عدد را چندك مرتبه p ميناميم هر گاه p 100%دادهها سمت چپ و (p -1) 100% دادهها سمت راست باشند.چندكهاي معروف عبارتند از :چاركها چاركها به ازاي 75/0 ، 5/0 ، 25/0 =p به دست ميآيند و آنها را به ترتيب با نماد (چارك اول)، (چارك دوم) و (چارك سوم)نشان ميدهند.دهكهادهكها به ازاي 9/0، .....،2/0 ،1/0=p به دست ميآيند و آنها را به ترتيب با نماد (دهك اول)، (دهك دوم)،...... و (دهك نهم) نشان ميدهند. معيارهاي مركزي:صدكهاصدكها به ازاي 99/0،.....02/0، 01/0=p به دست ميآيند و آنها را به ترتيب با نماد (صدك اول)، (صدك دوم)،.....و (صدك نود و نهم) نشان ميدهند.نماچندكهاميانهميانگين
اسلاید 38: معيارهاي مركزي:محاسبه چندك براي دادههاي گسستهفرض كنيد دادههاي ما باشند و شكل مرتب شده آنها را با نمايش دهيم. براي محاسبه چندك صحيح باشدصحيح نباشدنماچندكهاميانهميانگين
اسلاید 39: نمودارهاي آماري:محاسبه چندك براي دادههاي پيوستهكلاس55/1_35/175/1_55/195/1_75/115/2_95/135/2_15/255/2_35/275/2_55/295/2_75/2جمع45/165/185/105/225/22/4565/285/246129862350410223139454750_با توجه به ستون فراواني تجمعي در جدول فراواني، كلاسي را كه چندك در آن قرار دارد مشهص ميكنيم. نماچندكهاميانهميانگين
اسلاید 40: نمودارهاي آماري:دادهاي كه فراواني آن نسبت به ديگر دادهها بيشتر باشد، نما يا مد ناميده ميشود و آن را با نماد Mنمايش ميدهيم. براي به دست آوردن نما، نخست فراواني دادهها را پيدا ميكنيم و دادهاي را كه فراواني آن بيشتر باشد، به عنوان نما اختيار ميكنيم و اگر دو داده، داراي فراواني يكسان و بيش از ديگر فراوانيها باشند، هر دو را به عنوان نما اختیار ميكنيم و دادهها را دو نمايي ميگوييم، به شرط آن كه اين دو داده در يك صف غير نزولي،كنار هم نباشند. در صورتي كه اين دو داده در يك صف غير نزولي،كنار هم باشند نصف مجموع آنها را به عنوان نما اختيار ميكنيم. اگر تمام داده داراي فراواني يكسان باشند،ميگوييم دادهها بدون نما هستند. به ياد داشته باشيد كه نما، به عنوان يك معيار تمركز در دادههاي گروهي به كار گرفته ميشود.محاسبه نما براي دادههاي گسستهنماچندكهاميانهميانگين
اسلاید 41: نمودارهاي آماري:مثال: براي دادههاي 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زيرا فراواني داده 9 بيش از فراواني ديگر دادهها است.مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختيار ميشوند، زيرا فراواني اين دو داده، بيش از فراواني دادههاي ديگر است.مثال: براي دادههاي 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زيرا تمام دادهها داراي فراواني يكسان هستند.مثال: براي دادهها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7و 9دو داده 4و 5 را كه داراي بيشترين فراواني هستند به عنوان نما بر ميگزينيم،اما از آنجا كه اين دو داده در يك صف غير نزولي در كنار يكديگر قرار دادند،نصف مجموف دو داده به عنوان نما اختيار ميشود، يعني 5/4=M.نماچندكهاميانهميانگين
اسلاید 42: نمودارهاي آماري:محاسبه تما براي دادههاي پيوستهكلاس55/1_35/175/1_55/195/1_75/115/2_95/135/2_15/255/2_35/275/2_55/295/2_75/2جمع45/165/185/105/225/22/4565/285/246129862350از روي جدول ملاحظه ميشود كه فراواني رده 95/1_75/1 داراي بيشترين فراواني است بنابراين به عنوان رده نما در نظر ميگيريم.08/012/024/018/016/012/004/006/000/112/0-24/018/0-24/0نماچندكهاميانهميانگين
اسلاید 43: معيارهاي پراكندگي:با وجود این كه در بسیاری از موارد، میانگین توصیف نسبتا كاملي از مجموعه دادهها ارائه ميدهد، اما گاهي وجود اطلاعات بیشتر در مورد دادهها ضروری است. يك مفهوم مهم در ارتباط با دادههاي آماری، ميزان تغييرات آنهاست،بدين معني كه اندازهگيريها تا چه اندازه از فردي به فرد ديگر يا شيي به شيي ديگر تغيير ميكنند. در اين بخش، به بررسي و محاسبه ميزان تغيرات به عنوان معیارهای پراکندگی خواهيم پرداخت. مهمترین معیارهای پراكندگي عبارتند از دامنه، ميانگين انحراف ها از میانگین يا از میانه، ميان دامنه چاركها، دامنه صدكي، واريانس و انحراف معيار است. علاوه بر مطالب فوق، در اين بخش دادههاي استاندارد و ضريب تغيرات را نيز معرفی خواهیم كرد.
اسلاید 44: معيارهاي پراكندگي:اگرچه دامنه يك وسيله ساده براي اندازهگيري اختلاف و پراكندگي در يك سري از دادهها است، اما در بيشتر موارد رضايتبخش نيست. دادههاي بسيار بزرگ يا بسيار كوچك مانع از آنند كه دامنه، معرف واقعي ميزان انحراف باشد. در چنين مواردي، واريانس يك معيار مورد قبول همگان به شمارميرود.با توجه به اينكه در محاسبه واريانس دادهها را مربع ميكنيم، بدين جهت ريشه دوم مثبت آن را كه انحراف معيار يا انحراف استاندارد ميناميم، به عنوان يك معيار پراكندگي بر مبناي مقياس اندازهگيري به كار ميبريم.ضريب تغيير عبارت است از اندازه نسبي انحراف معيار در مقايسه با ميانگين. ضريب همبستگي به واحد اندازهگيري وابسته نيست و براي مقايسه جمعيتهاي يكسان به كار ميرود. در مقايسه هر اندازه كه ضريب تغيير ويژگي جمعيتي كمتر باشد،ويژگي آن چمعيت بهتر ارزيابي ميشود.
اسلاید 45: معيارهاي پراكندگي:اگر نمايانگر دادههاي خام باشند، براساس جدول فراواني تا از ها برابر ، تا برابر ،.......و تا برابر است. ميدانيم كه و به ترتيب ميانگين و انحراف معيار داده است. اگر از هر داده را كم و بر تقسيم كنيم ، يعني آنگاه با فراوانيهاي به ترتيب را دادههاي استاندارد ميناميم. به سادگي ميتوان نشان داد كه دادههاي استاندارد داراي ميانگين برابر با صفر و واريانس برابر با يك 1 هستند و به واحد اندازهگيري بستگي ندارند.دادههاي استاندارد
اسلاید 46: معيارهاي پراكندگي:چون ، بنابراين نتيجه ميگيريم كه دانشجويان در امتجان دوم نمرات مطلوبتري را كسب كردهاند.ب) براي مقاسه، ابتدا نمرات دانشجو را استاندارد ميكنيمچون ، بنابراين نمره آزمون دوم دانشجو د رمقايسه از موقعيت بهتري برخوردار است.
اسلاید 47: معیارهای پراکندگیفرض كنيد يك دسته از دانشجويان در دو امتحان شركت كردهاند و خلاصه نتاسج آزمونها به شرح زير است.آزمون اول: ميانگين نمرات برابر 60، انحراف معيار برابر 6، ماكزيمم نمره از 100آنمون د.م: ميانگين نمرات 700، انحراف معيار برابر 7، ماكزيمم نمره از 1000الف- چگونه اين دو نتيجه را با هم مقيسه و ارزيابي ميكنيد؟ب- اگر دانشجويي در آزمون اول نمره 65 و در آزمون دوم نمره 720 را كسب كرده باشد، وضعيت دانشجو در كدام آزمون مطلوبتر است؟حل: الف) با محاسبه ضريب تغيير دو آزمون معلوم ميشود كه
اسلاید 48: منحنيهاي فراواني:پخبرجستهنامتقارن/ چوله به چپنامتقارن/ چوله به راستمنحني نرمال استاندادمنحنيهاي فراواني در طبيعت تنوع زيادي دارند، اما بسياري از منحنيهاي فراواني تك نمايي يا متقارن هستند يا چوله و يا برجسته و يا پخ. ايده آلترين منحني فراواني متقارن، منحني فراواني نرمال استاندارد است. براي منحنيهاي فراواني كاملا متقارن تك نمايي مقادير ميانگين،ميانه و نما بر هم منطبق ميشوند. در طبيعت،عموما منحني فراواني متقارن ايده آل كمتر يافت ميشود و بسياري از منحنيهاي فراواني موجود در طبيعت نامتقارن برجسته يا پخ هستند. ميزان انحراف از تقارن ايده آل را معمولا با دو معيار چولگي و برجستگي ميسنجند.
اسلاید 49: منحنيهاي فراواني:چولگي:به راست يا مثبتبه چپ يا منفيمعیار اندازه گیری چولگی:ضریب چولگی اول پیرسن
اسلاید 50: منحنيهاي فراواني:میزان کشیدگی یا پخی منحنی فراوانی را یسبت به منحنی نرمال استاندارد، برجستگی منحنی فراوانی می نامیم. فرمول زیر را می توان به عنوان معیار برجستگی به کار برد.ضریب برحستگی صدکینشان داده شده است که برای منحنی فراوانی نرمال استاندارد k=0.263 ، بنابراین معمولا ضریب برجستگی را به صورت زیر تعریف می کنند:ضریب برحستگی صدکیبرحسب آن که این مقدار مثبت یا منفی باشد گوییم منحنی فراوانی برجسته یا پخ است.
اسلاید 51: نمودار جعبه ای:همان گونه که گفته شد، روشهای نموداری و خلاصه کردن داده ها به صورت مقادیر عددی موضوعی اساسی در تجزیه و تحلیلهای آماری است. پیش از این دیدیم که چگونه نمایش نمودار تنه و شاخه را می توان به عنوان ابزاری ساده و مهم در نمایش و استنباط از داده ها به کار گیریم که چنین نموداری بسیار همانند نمودار هستوگرام بود.نموار با ارزش دیگری که برخی از امتیازهای دیگر را در مقایسه با نمودار تنه و شاخه دارد نمودار جعبه ای است که برخی از امتیازهای دیگر را در مقایسه با نمودار تنه وشاخه دارد . نمایش نمودار جعبه ای بر پایه داده های مرتب شده از کوچک به بزرگ و تعیین میانه، چارک اول و چارک سوم است.
اسلاید 52: نمودار جعبه ای:گام اولنمایش نمودار تنه و شاخه،91011121314152 0 9 0 0 9 8 7 7 6 6 5 0 9 9 9 9 9 5 0 0 0 4 0گام دومتعیین مکان میان، چارک اول و چارک سوم،= مکان میانهبا توجه به مقدار به دست امده میانگین داده های دوازدهم و سیزدهم را به عنوان میانه در نظر می گیریم، یعنی
اسلاید 53: نمودار جعبه ای:برای تعیین مکان چارک اول و سوم به صورت زیر عمل می کنیممکان میانهمکان چارکهابا توجه به مقدار به دست آمده، میانگین داده های ششم و هفتم از پایین به بالا را به ترتیب به عنوان چارک اول و چارک سوم در نظر می گیریم، یعنیچارک اولچارک سومنکتهدر صورتی که مقادیر به دست آمده در مکانها اعداد صحیح باشند، داده همان مرتبه به عنوان میانه، چارک اول و چارک سوم در نظر گرفته می شود.میانه و چارکها به دست آمده در ارایه نمایشی برای نمودار جعبه ای با روش بیان شده در بخش های قبل فرق دارد. در حقیقت معیارهای به دست آ»ده از این روش را هینج می نامند که کمی با معیارهای گفته شده متفاوت است.
اسلاید 54: نمودار جعبه ای:گام سومتعیین دو فاصله به عنوان حصارهای درونی و بیرونی است،نخست دامنه چارکها را محاسبه می کنیم ،کرانهای حصار درونی را به صورت زیر تعریف می کنیم:کران بالای حصار درونیکران پایین حصار درونیبنابراین حصار درونی در این مثال به صورت زیر تعریف می شود
اسلاید 55: نمودار جعبه ای:کرانهای حصار بیرونی را به صورت زیر تعریف می کنیم:در نتیجه فاصله زیر، حصار بیرونی در این مثال است،گام چهارمتعیین مقادیری از داده ها که در همسایگی کرانهای حصار درونی است.در حقیقت مقادیر این داده ها در حصار درونی قرار دارد و کمینه بیشینه مقدار ممکن از داده ها در حصار درونی است که نزدیک به کران بالا و پایین حصار درونی است. همسایگی کران پایین را با نماد LA و همسایگی کران بالا را با نماد UA نمایش می دهیم. بنابراین در این مثال،
اسلاید 56: نمودار جعبه ای:گام پنجمتعیین داده های پرت،هر داده بیرون از حصار درونی را داده پرت می نامیم. در صورتی که این داده ها بیرون از حصار بیرونی نباشد، آن را داده پرت معتدل و به جز این صورت آن را داده پرت غایی می نامیم.نمادی که برای نمایش داده های پرت در نمودار جعبه ای به کار خواهیم برد، دایره توخالی برای داد پرت معتدل و دایره توپر برای داده پرت غایی.در نتیجهLOF<x<LIFLOFLIFUOFUIFداده پرت معتدل بالاX<LOFداده پرت غایی پایینUIF<x<UOFداده پرت معتدل پایینX>UOFداده پرت غایی بالا
اسلاید 57: نمودار جعبه ای:بنابراین در این مثال داده های پرت عبارتند از: 154، 150، 92و 90 و داده پرت غایی نداریم.LOFLIFUOFUIF8090100110120130140150160LAUAmIQR
اسلاید 58: Transitional Page
اسلاید 59: Elementswww.animationfactory.com
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.