آشنايی با آمار توصيفي پيشگفتار: در عصر حاضر كسي نمي تواند منكر این واقعیت باشد كه آمار نقشي الینفک در زندگي روزمره ما بازي ميكند .اخبار روزانه رسانههاي گروهی با گزارشی از وضع هوا به پایان مي رسندو در طول اخبار ،به جریانهای بازار بورس و سهام اشاره ميشود و روزنامهها خبر از افزایش نرخ اجناس ميدهندو... آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود ،در بسیاری از به كار گرفته ميشود .در زمينه هاي علمي از جمله جامعه شناسي ،کشاورزی ،فيزيك و .... دانش امروزي ،معموال سعی ميشود كه اطالعات موجود در يك زمينه خاص ،در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطالعات ،فهم بهتری از پدیده مورد به دست آمده و امکان مقایسه فراهم گردد .در يك جمله آمار مجموعهاي مطالعه از روشهای جمع آوری ،تهيه وتنظیم و تجزیه و تحلیل اطالعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته ميشود. آمار توصيفي: گيريها جمع آوري براي اينكه نتايج مناسب و مطلوب از اطالعات كه در آمار ميكنيم ،به دست آيد بايد: اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشند به نحو مفيدي تهيه و تنظيم شوند :به نحو صحيح تجزيه و تحليل گردند آم ا ر ت قابل نتيجه گيري صحيح باشند و ص ی ف ی روشهايي را كه به وسيله آنها ميتوان اطالعات جمع آوري به طور كلي، شده را تنظيم كرده و خالصه نمود ،آمار توصيفي ميناميم و در يك كالم آمار توصيفي عبارت از مجموعه روشهايي است كه پردازش دادهها را فراهم ميسازد .اطالع از اصطالحات زير در آمار ضروري است. اس ون م قي م ن ير ت غ مت عي جم اده زه د دا ان ي ها ه :آمار توصيفي ير گ ي :م ث ا ل : نك ت ه مجموعه افراد يا اشيايي را كه ميخواهيم يك يا چند خصوصيت مشترك آنها را مورد بررسی قرار دهيم ،جمعيت يا جمعيت آماري ميناميم. اندازه قد يا وزن دانشجويان بيست ساله يك شهر ،تعداد المپهاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، آماري هستند. مثالهايي از جمعيتهاي معموال مطالعه ويژگيهاي مورد نظر ،به هنگامی كه جمعیت آماری بسیار گسترده باشد ،مستلزم صرف هزینه و وقت زيادي مي باشد و در بسیاری از مواقع ،اين امر اصوال امکان پذیر نیست. بنابراین در چنین موردی ،براي مطالعه ویژگی مورد نظر ،به قسمتی از جمعیت آماری اکتفا ميكنيم. اس غي نه قي مت مو م ن ت عي جم اده زه د دا ان ي ها ر آمار توصيفي: نک ت ه : مث ا ل ير گ ي نم و نه قسمتي از جمعيت را كه طبق قاعده و ضوابط خاصي ،براي مطالعه خصوصيتي از جمعيت انتخاب ميشود ،يك نمونه از جمعيت ميناميم. اين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد .با توجه به اهميت اين موضوع شاخهاي از آمار تحت عنوان نظريه نمونهگيري با بررسي نمونهاي به اين امر ميپردازد .در بسياري از موارد ،معموال نمونه مهم تصادفي ساده را در نظر ميگيرند. براي بررسی اندازه قد دانشجویان بیست ساله يك شهر ،انتخاب مثال 150نفر از بین اين جمعیت به طور تصادفی ،يا انتخاب 100المپ به تصادف از المپهاي توليدي يك کارخانه در يك روز معین ،براي تعيين كيفيت المپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند. س يا مق نه مو ن ت عي جم ير گ اده زه د اندا ير تغ هاي م آمار توصيفي: معموال دو نوع متغير در آمار مورد نظر هستند: ‗ متغيرهاي گروهي ،نظير رنگ ،نژاد ،شغل و گروه خوني كه ميباشند. شامل چند گروه يا طبقه ‗متغيرهاي عددي كه ممكن است نتيجه شمارش باشد ،مانند تعداد احشام هر خانوار در يك روستا،تعداد حوادث در يك كارخانه اندازهگيري باشد ،مثل قد در روزهاي مختلف ،و يا نتيجه دانشجويان بيست ساله در يك شهر ،حجم شربت مولتي ويتامين با استاندارد خاص. ي خصوصیت مورد مطالعه ،از فردی به فرد دیگر ،يا از شي به شي دیگر در جمعیت آماری تغيير ميكند ،كه آن را اصطالحا متغير ميناميم. س يا مق نه مو ن ت عي جم ير گ اده زه د اندا ير تغ هاي م آمار توصيفي: متغيرهاي پیوسته متغيرهاي عددي كه از راه شمارش بهدست آمده اند متغيرهايي را كه از طريق اندازهگيري به دست آمده باشند ي متغير: متغيرهاي گسسته متغيرهاي گروهي ت م نه مو ن ت عي جم زه دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ ي اندازهگيري ویژگی يك متغیر مستلزم آگاهی و در بسیار از مسائل پيشرو، شناخت خاصي است .به طور كلي چهار نوع مقیاس براي اندازه گيري وجود دارد: مقياس اسمي مقياس ترتيبي فاصلهاي مقياس مقياس نسبتي ت م نه مو ن ت عي جم ير گ مقياس :اسمي ي اين نوع مقياس اندازهگيري عمدتا براي طبقه بندي دادهها به كار ميرود و منظور از آن اتالق يك عدد طبيعي به دادههاي متفاوت است. :مثال زه دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: گروههاي خوني اختصاص اعداد 1تا 4به .A,B, AB, O :توجه داشته باشيد كه نميتوان براي مقايسه يا چهار عمل اين اعداد را اصلي به كار برد ت م نه مو ن ت عي جم زه دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: :مثال در يك كارخانه ممكن است كارگران را به سه دسته ساده ،نيمه ماهر و ماهر تقسيم بندي كنيم .اتالق به ترتيب اعداد 1تا 3به اين سه دسته يك مقياس ترتيبي است. :توجه داشته باشيد كه اين اعداد تنها براي مقايسه به كار ميروند و نميتوان با آنها چهار عمل اصلي را انجام داد. ير گ دادهها اندازهگيري عموما براي طبقه بندي اين نوع مقياس ميرود .به منظور يك نوع برتري به كار ي مقياس :ترتيبي ت م نه مو ن ت عي جم زه دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ مقياس :فاصله اي ي زمينههاي كه عالوه بر حفظ ترتيب به نحوي فاصله بين ويژگيها اين نوع مقياس اندارزهگيري عموما در را نيز حفظ ميكند .به عبارت ديگر در چنين مقياسي نسبت تفاضلها ثابت ميماند. :مثال اندازهگيري ضريب هوشي دانش آموزان كالس اول .دبستان در شهر اصفهان :توجه داشته باشيد كه در اين نوع مقياس ،عدد صفر يك مفهوم قراردادي است. ت م نه مو ن ت عي جم زه دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ ي مقياس :نسبتي ميكند .به عبارت اندازهگيري عالوه بر حفظ فاصله ،نسبت را نيز حفظ اين نوع مقياس اندازهگيري ندارد. اندازهگيري نسبت دو مقدار بستگي به واحد ديگر در اين نوع اس غي ت قي م م نه مو ن ت عي جم ه داد ير هگ از ند يا ها ر آمار توصيفي: ي ميآيند ،معموال شامل انبوهي عدد يا اطالعاتي كه از مطالعه يك متغير به دست دادهها را نسبت به نوع متغيري كه ميناميم. ميباشند كه آنها را داده عالمت دادههاي پيوسته تقسيم ميكنيم به دو دسته داده گسسته و اندازه گيري ميكنيم. ده دا خام دادههاي جمع آوري شده كه انبوهي عدد است و معموال به هيچ نوع پردازشی روي آنها انجام نشده است داده خام ميگويند. اس غي ت قي م م نه مو ن ت عي جم ه داد ير هگ از ند يا ها ر آمار توصيفي: ي مواردي كه در ارتباط با يك مجموعه از دادههاي ميبايستي مد نظر عبارتاند از: داد، قرار ‗ ‗ خالصه كردن و توضيح دادهها به وسيله تنظيم جداول و رسم نمودارها. محاسبه مقادير عددي ،براي دست يافتن به معيارهايي كه تمركز و يا پراكندگي دادهها را نشان دهد. دادههاي خام واقعيتهاي موجود را استخراج در آمار،براي اينكه از كنيم،آنها را به نحوي مناسب دستهبندي كرده و جدولهايي به نام مينماييم .متداولترين جدول در آمار ،جدول جدولهاي آماري تهيه فراواني است. پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم،اطالع از اصطالحات زير ضروري است. نمودارهاي آماري: معموال دادهها را با نمودارهاي مختلف نمايش ميدهند .عموما اين نمودارها در آنها ،تجسم ارتباط با داده هاي پيو.سته به كار گرفته مي شود و منظور از نمايش دادهها است .در اين بخش به معرفي چند نمودار عيني اطالعات نهفته در معروف اكتفا ميكنيم: ‗ هيستوگرام ‗چندبر فراواني ‗چندبر فراواني تجمعي ‗منحنيهاي فراواني و فراواني تجمعي ‗نمايش نمودار تنه و شاخه جعبهاي ‗نمودار ن چن .....ماي چن دبر منح ش ن دبر ف ني م و ف راو ها دا ر ت را ان ي هي وان ي فر نه او و ست ي ت ج ا ش ن وگ مع ي اخ ر و ا ي نمودارهاي آماري: م ارتفاع هر مستطيل برابر فراواني نسبي عرض مستطيل برابر طول واقعي كالس 24/0 مركز هر مستطيل نماينده كالس 12/0 /3 15 /2 95 /2 75 /2 55 /2 35 /2 15 /1 95 /1 75 /1 55 /1 35 /1 15 04/0 25 ن چن .....ماي دب منح ش ن ر ف ني م هي و ست راو ها دا ر و ا گ ت ن ي رام چن ي ت فر نه دب ج ا و و م ش ر ان فر عي ي اخ ا و و ا ن ي نمودارهاي آماري: 24/0 12/0 /3 05 /2 95 /2 75 /2 55 /2 35 /2 15 /1 95 /1 75 /1 55 /1 35 /1 25 04/0 ن .....ماي منح ش ه چن ن د ن يس بر چندب ي مو د توگ فرا ر هاي ار ت را وان فرا فر نه و ا او و م ي ا ن ش ن ي ت ي اخ ج و نمودارهاي آماري: 00/1 94/0 90/0 مع ي 78/0 62/0 /2 35 08/0 /2 15 /3 05 /2 95 2/0 /1 95 /2 75 44/0 /1 75 /1 55 /1 35 /1 25 /2 55 از اتصال نقاطي كه طول آنها مرز كالس و عرض آنها فراواني نسبي تجمعي تا آن مرز باشد ،يك خط شكسته به دست ميآيد كه آن را چندبر فراواني تجمعي مينامند 25 ن چن ماي د چن بر ش . . ف هي دبر را ...م نم و ستو فر وان نحن دا ر گ ا ي ت رام وان تج يها نه ي مع ي و ش فر ا ا ي خ وا ن ه ي و نمودارهاي آماري: نمودار منحني فراواني 1 نمودار منحني فراواني تجمعي ن چن .... . م دب منح اي ه چن ر ف ني ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه نمودارهاي آماري: *** 4/1 * 5/1 *** 6/1 *** 7/1 ** ****** 8/1 **** ****** 9/1 *** ***** 0/2 ******** **** ½ ***** 2/2 *** 3/2 *** 4/2 *** 5/2 ** 6/2 7/2 8/2 *** 9/2 فرا و ا ن ي ******* *** **** 2 3 4 5 6 7 8 نمودارهاي آماري: نمرات 80دانشجو در امتحانات نهايي درس احتمال و آمار :به شرح زير است 93 76 88 62 90 68 82 75 84 68 75 85 59 71 93 60 73 88 79 73 72 63 78 95 62 74 87 75 65 61 60 68 74 69 77 94 75 82 78 66 71 83 79 60 95 75 61 89 78 99 75 71 65 76 85 78 97 67 62 79 74 50 76 62 78 88 57 73 80 65 77 85 75 76 63 72 81 73 67 86 ن چن .... . م دب منح اي ه چن ر ف ني ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه تنه شاخه 097 5 083520923208177255618 6 74512516569486618728545333558899 7 535858172928046 8 35530479 9 نمودارهاي آماري: ن چن .... . م دب منح اي ه چن ر ف ني ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه پس از ساختن نمودار اوليه معموال بهتر است مقادير هر شاخه را از كوچك به بزرگ ،با :تعداد دفعات تكرار،مرتب كرد ،به صورت زير 970 5 98 87 655533222211000 6 999888887766665555555444333322111 7 988876555432210 8 97554330 9 مي معيارهاي مركزي: انگي ميا چ ن ن ن نه دكه ما ا با استفاده از جدول فراواني و رسم نمودارها ميتوانيم دادهها را به نحو مطلوبي تنظيم كرده و اطالعات نهفته را تا حدودي مشخص كنيم .با اين حال براي ارايه يك گزارش مناسب،بهتر است آنها را در يك يا چند عدد مناسب نيز خالصه كنيم .چنين عددي ميتواند معيار مركزي باشد .مهمترين معيارهاي مركزي ميانگين ،ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت . نوع x 1 , x 2 , , xk فرض2 k ،با n ،به kاز داده هرگاه y 1 , y 2f,1 , f 2, ,yn , f k ترتيب nبا تعدادهاي ميگوييم. fi باشندx i،آنگاه تشكيل شده را فراواني 1 ميانگين= x fx i i n i=1 حسابي n k wx ميانگين = w وزني i i k 1 i=1 k xw i=1 k ميانگين G =( xif )n هندسي i=1 i كليه دادهها بزرگتر از صفر باشند ميا ن گي ن معيارهاي مركزي: چن ن د م كه ا م ا يا ن ه ناميم،اگر نماييم،عدد mرا ميانه اين دادهها مي اگر دادهها را از كوچك به بزرگ مرتب نصف دادهها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيرد دادههاي گسسته محاسبه ميانه براي فرض كنيد y 1 , y 2 , , y n آنها, yرا)(1باy مرتب , y شده(2) , ) (n دادههاي ما باشند و شكل نمايش دهيم آنگاه اگر nفرد باشد ) y n 1 2 ( =M اگر nزوج باشد 1 ] [y n y n )( 1 )2 (2 2 ميا ن گي ن معيارهاي مركزي: چن ن د م كه ا م ا يا ن ه دادههاي پيوسته محاسبه ميانه براي n 25 2 n Fb m L m ( 2 )w fm طو ل رده هر Fi fi xi كالس 4 4 45/1 55/1_35/1 10 6 65/1 75/1_55/1 22 12 85/1 95/1_75/1 31 9 05/2 15/2_95/1 39 8 25/2 35/2_15/2 45 6 2/45 55/2_35/2 47 2 65/2 75/2_55/2 50 3 85/2 95/2_75/2 _ 50 جمع مي معيارهاي مركزي: انگي ميا ن ن ه ن ما چ ند ك چندك يك معيار كلي تر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر ها ميگيرد .اگر pيك عدد حقيقي بين صفر وQ p باشد،آنگاه عدد يك ميناميم هر گاه p 100% چندك مرتبه p دادهها سمت چپ و ( 100% )p -1دادهها سمت Q p راست را باشند. چندكهاي معروف عبارتند از : چاركها را به ترتيب1باQ ‗ چاركها به ازاي p= 25/0 ، 5/0 ، 75/0به دست ميآيند و آنها Q ( Q2 ( Q3 (چارك سوم)نشان چارك دوم) و چارك اول)، نماد p ميدهند. دهكها D1 دهكها به D 2 ازاي D 9p=1/0، 2/0،..... ،9/0 به دست ميآيند و آنها را به ترتيب با نماد صدكها (دهك نهم) نشان ميدهند. (دهك دوم) ......،و (دهك اول)، ترتيبPبا نماد صدكها به ازاي p=01/0 ،02/0.....،99/0به دست ميآيند و آنها را به 1 (صدكP99 دوم).....،و (صدك نود و نهم) نشان ميدهند. اول)، (صدكP2 مي معيارهاي مركزي: انگي ميا ن ن ه ن ما چ ند ك ها دادههاي گسسته محاسبه چندك براي كنيدy 1 , y 2 فرض, , yn آنها ,را) (1باy شده)y (2 مرتب , , دادههاي ما باشند و شكل ) y ( n نمايش دهيم .براي محاسبه چندك ) Q p y( r r ( n 1) p, صحي ح با شد د( n 1) p )Q p (1 ) y ( r ) y ( r 1 r [( n 1) p ], =(n+1)p-r اش ح نب ص حي مي نمودارهاي آماري: انگي ميا ن ن ه ن ما چ ند محاسبه چندك براي دادههاي پيوسته با توجه به ستون فراواني تجمعي در جدول فراواني ،كالسي را كه چندك در آن قرار .دارد مشهص ميكنيم )(p) (n 0.25 50 12.5 np Fb )w f Qp ( Q p LQ p 50 0.25 10 ) 0.2 12 ( Q p 1.75 ك ها Fi fi xi كالس 4 4 45/1 55/1_35/1 10 6 65/1 75/1_55/1 22 12 85/1 95/1_75/1 31 9 05/2 15/2_95/1 39 8 25/2 35/2_15/2 45 6 2/45 55/2_35/2 47 2 65/2 75/2_55/2 50 3 85/2 95/2_75/2 _ 50 جمع نمودارهاي آماري: ميان ميا چن د نه ك گي ها ن دادههاي گسسته محاسبه نما براي باشد ،نما يا مد دادهاي كه فراواني آن نسبت به ديگر دادهها بيشتر ناميده ميشود و آن را با نماد Mنمايش ميدهيم .براي به دست نما ،نخست فراواني دادهها را پيدا ميكنيم و دادهاي را كه آوردن داده، باشد ،به عنوان نما اختيار ميكنيم و اگر دو فراواني آن بيشتر داراي فراواني يكسان و بيش از ديگر فراوانيها باشند ،هر دو را به گوييم ،به شرط آن عنوان نما اختیار ميكنيم و دادهها را دو نمايي مي نزولي،كنار هم نباشند .در صورتي كه كه اين دو داده در يك صف غير نزولي،كنار هم باشند نصف مجموع آنها را اين دو داده در يك صف غير به عنوان نما اختيار ميكنيم .اگر تمام داده داراي فراواني يكسان ميگوييم دادهها بدون نما هستند .به ياد داشته باشيد كه نما،به باشند ، عنوان يك معيار تمركز در دادههاي گروهي به كار گرفته ميشود. ن ما نمودارهاي آماري: ميان ميا چن د گي نه ك ه ا ن مثال :براي دادههاي 12 ،11 ،10 ،10 ،9 ،9 ،9 ،7 ،5 ،2 ،2و 18نما برابر M=9 است ،زيرا فراواني داده 9بيش از فراواني ديگر دادهها است. مثال :براي دادهها 7 ،7 ،7 ،5 ،5 ،4 ،4 ،4 ،3 ،2و ،9دو داده 4و 7به عنوان نما اختيار مي شوند ،زيرا فراواني اين دو داده ،بيش از فراواني دادههاي ديگر است. مثال :براي دادههاي 15 ،12 ،10 ،8 ،5 ،3و ،16نما وجود ندارد ،زيرا تمام دادهها داراي فراواني يكسان هستند. مثال :براي دادهها 7 ،7 ،5 ،5 ،5 ،4 ،4 ،4 ،3 ،2و 9دو داده 4و 5را كه داراي گزينيم،اما از آنجا كه اين دو بيشترين فراواني هستند به عنوان نما بر مي دادند،نصف مجموف دو داده در يك صف غير نزولي در كنار يكديگر قرار شود ،يعني .M=5/4 داده به عنوان نما اختيار مي ن ما ميان ميا چن د نه ك گي ها ن نمودارهاي آماري: دادههاي پيوسته محاسبه تما براي ميشود كه از روي جدول مالحظه فراواني رده 75/1_95/1داراي بيشترين فراواني است بنابراين به ميگيريم. عنوان رده نما در نظر d1 d1 d 2 M L M 18/0-24/0 0.12 0.2 0.12 0.06 12/0-24/0 M 1.75 fi xi كالس 4 08/0 45/1 55/1_35/1 6 12/0 65/1 75/1_55/1 12 24/0 85/1 95/1_75/1 9 18/0 05/2 15/2_95/1 8 16/0 25/2 35/2_15/2 6 12/0 2/45 55/2_35/2 2 04/0 65/2 75/2_55/2 3 06/0 85/2 95/2_75/2 ri 50 00/1 جمع ن ما معيارهاي پراكندگي: با وجود این كه در بسیاری از موارد ،میانگین توصیف نسبتا كاملي از دهد ،اما گاهي وجود اطالعات بیشتر در مجموعه دادهها ارائه مي مورد دادهها ضروری است .يك مفهوم مهم در ارتباط با دادههاي آنهاست،بدين معني كه اندازهگيريها تا چه آماری ،ميزان تغييرات اندازه از فردي به فرد ديگر يا شيي به شيي ديگر تغيير ميكنند .در اين بخش ،به بررسي و محاسبه ميزان تغيرات به عنوان معیارهای پراکندگی خواهيم پرداخت .مهمترین معیارهای پراكندگي عبارتند از دامنه ،ميانگين انحراف ها از میانگین يا از میانه ،ميان دامنه چاركها ،دامنه صدكي ،واريانس و انحراف معيار است .عالوه بر مطالب فوق ،در اين بخش دادههاي استاندارد و ضريب تغيرات را نيز معرفی خواهیم كرد. اگرچه دامنه يك وسيله ساده براي معيارهاي پراكندگي: اندازهگيري اختالف و پراكندگي در يك سري از دادهها است ،اما در )y (1بزرگترين ) y ( n دامنه هستند داده كوچكترين و نيست. موارد بيشتر رضايتبخش R y y ) (n )(1 دادههاي بسيار بزرگ يا بسيار معرف دامنه، مانع از آنند انحرافها ميانگين كه 1 k كوچكدر با توجه به اينكه محاسبه| MD x f i | xi x انحراف nباشد .در ميزان واقعي از ميانگينi 1 كنيم، مربع مي واريانس دادهها را واريانس kيك معيار مواردي، چنين آن را دوم مثبت بدين جهت ريشه انحرافها ميانگين همگان MD mبه قبول مورد انحراف f i | x i |m كه انحراف معيار يا ميانه از i 1 شمارميرود. عنوان يك ميناميم ،به استاندارد اندازه ضريب تغيير عبارت است از دامنه مقياس مبناي بر پراكندگي معيار چاركيIQR Q Q 3 1 نسبي انحراف معيار در مقايسه با واحد به كار ميبريم. بهگيري اندازه ميانگين .ضريب همبستگي صدكي دامنه IPR P90 P10 اندازهگيري وابسته نيست و براي مقايسه جمعيتهاي يكسان به كار k k 2 داده 1 1 ها 2 2 2 واريانسs f i ( x ميرود .در مقايسه هر اندازه كه f i x i x i x ) n i 1 n i 1 ضريب تغيير ويژگي جمعيتي كمتر k 1 2 باشد،ويژگي آن چمعيت بهتر معيار s انحرافf i ( x ) i x n i 1 ارزيابي ميشود. s ضريب تغييراتv x معيارهاي پراكندگي: فراوانيy نمايانگر دادههاي خام باشند ،براساس f 1 i تا از جدول اگر f برابرx 2 ، y ,ها f y2 x 1, y تا برابرk است .ميxدانيم كه k .......،و xتا برابر , 1 2 n s را كم و بر داده هر از اگر . است داده معيار انحراف و ميانگين ترتيب به و s x تقسيم كنيم ،يعني , i=1, ,k xi x z دادههاي استاندارد i s f , f , , f آنگاهz 1 , z 2 , , z k 1 2 با فراوانيهاي به ترتيبk را دادههاي استاندارد ميناميم .به سادگي ميتوان نشان داد كه دادههاي استاندارد داراي ميانگين برابر با صفر و واريانس برابر با يك 1هستند و به واحد اندازهگيري .بستگي ندارند معيارهاي پراكندگي: چون ، v 1 v 2بنابراين نتيجه ميگيريم كه دانشجويان در امتجان دوم نمرات مطلوبتري را كسب كردهاند. مقاسه ،ابتدا نمرات دانشجو را استاندارد ميكنيم ب) براي 720 700 20 7 7 .چونz 1 z 2 z1 65 60 5 , 6 6 z1 برخوردار است ،بنابراين نمره آزمون دوم دانشجو د رمقايسه از موقعيت بهتري معیارهای پراکندگی كردهاند و فرض كنيد يك دسته از دانشجويان در دو امتحان شركت خالصه نتاسج آزمونها به شرح زير است. آزمون اول :ميانگين نمرات برابر ،60انحراف معيار برابر ،6ماكزيمم نمره از 100 آنمون د.م :ميانگين نمرات ،700انحراف معيار برابر ،7ماكزيمم نمره از 1000 الف -چگونه اين دو نتيجه را با هم مقيسه و ارزيابي ميكنيد؟ ب -اگر دانشجويي در آزمون اول نمره 65و در آزمون دوم نمره 720را كسب كرده باشد ،وضعيت دانشجو در كدام آزمون مطلوبتر است؟ حل :الف) با محاسبه ضريب تغيير دو آزمون معلوم ميشود كه s 6 1 v1 1 %10 x 1 60 10 s1 7 1 %1 x 2 700 100 v2 منحنيهاي فراواني: نامتقارن /چوله به راست نامتقارن /چوله به چپ پخ منحنيهاي فراواني در طبيعت تنوع زيادي دارند ،اما بسياري از منحنيهاي فراواني تك نمايي يا متقارن هستند يا چوله و يا برجسته و يا پخ .ايده آلترين متقارن ،منحني فراواني نرمال فراواني منحني نرمالمنحني برجسته استانداد استاندارد است .براي منحنيهاي فراواني كامال ميانگين،ميانه و نما بر هم متقارن تك نمايي مقادير طبيعت،عموما منحني فراواني منطبق ميشوند .در متقارن ايده آل كمتر يافت ميشود و بسياري از منحنيهاي فراواني موجود در طبيعت نامتقارن برجسته يا پخ هستند .ميزان انحراف از تقارن ايده آل را معموال با دو معيار چولگي و برجستگي ميسنجند. منحنيهاي فراواني: ت يا اس ر به ت مثب M mx M m x چولگ :ي ب ه من چ پ في يا معیار اندازه گیری :چولگی M m x x mM x M ضریب چولگی اول s پیرسن منحنيهاي فراواني: میزان کشیدگی یا پخی منحنی فراوانی را یسبت به منحنی نرمال استاندارد ،برجستگی منحنی فراوانی می نامیم .فرمول زیر را می توان به .عنوان معیار برجستگی به کار برد ) (Q3 Q1 2 k ضریب برحستگی P90 P10 صدکی نشان داده شده است که برای منحنی فراوانی نرمال استاندارد ، k=0.263 بنابراین معموال ضریب برجستگی را به صورت زیر تعریف می کنند: ) (Q3 Q1 2 0.263 k ضریب برحستگی P90 P10 صدکی برحسب آن که این مقدار مثبت یا منفی باشد گوییم منحنی فراوانی .برجسته یا پخ است نمودار جعبه ای: همان گونه که گفته شد ،روشهای نموداری و خالصه کردن داده ها به صورت مقادیر عددی موضوعی اساسی در تجزیه و تحلیلهای آماری است .پیش از این دیدیم که چگونه نمایش نمودار تنه و شاخه را می توان به عنوان ابزاری ساده و مهم در نمایش و استنباط از داده ها به .کار گیریم که چنین نموداری بسیار همانند نمودار هستوگرام بود نموار با ارزش دیگری که برخی از امتیازهای دیگر را در مقایسه با نمودار تنه و شاخه دارد نمودار جعبه ای است که برخی از امتیازهای .دیگر را در مقایسه با نمودار تنه وشاخه دارد نمایش نمودار جعبه ای بر پایه داده های مرتب شده از کوچک به بزرگ .و تعیین میانه ،چارک اول و چارک سوم است نمودار جعبه ای: گام اول ،نمایش نمودار تنه و شاخه 20 9 900 10 9877 66 50 11 999995 12 00 13 0 14 40 15 گام دوم تعیین مکان میان ،چارک اول و ،چارک سوم n 1 24 1 12.5مکان = 2 2 میانه با توجه به مقدار به دست امده میانگین داده های دوازدهم و سیزدهم را به عنوان میانه در نظر می گیریم ،یعنی 118 119 m 118 .5 2 نمودار جعبه ای: برای تعیین مکان چارک اول و سوم به صورت زیر عمل می کنیم 1 12.5 1 12 1 6 .5 2 2 مکان 2 میانه مکان چارکها با توجه به مقدار به دست آمده ،میانگین داده های ششم و هفتم از پایین به نظر می گیریم ،یعنی باال را به ترتیب به عنوان چارک اول و چارک سوم در 110 115 Q1 چارک اول ن کته 112 .5 2 125 129 127 Q2 چارک 2 سوم در صورتی که مقادیر به دست آمده در مکانها اعداد صحیح باشند ،داده همان مرتبه به عنوان میانه ،چارک اول و چارک سوم در نظر گرفته می .شود میانه و چارکها به دست آمده در ارایه نمایشی برای نمودار جعبه ای با روش بیان شده در بخش های قبل فرق دارد .در حقیقت معیارهای به دست آ»ده از این روش را هینج می نامند که کمی با معیارهای گفته شده نمودار جعبه ای: گام سوم تعیین دو فاصله به عنوان حصارهای درونی و بیرونی ،است ،نخست دامنه چارکها را محاسبه می کنیم IQR Q3 Q1 125 112 .5 12.5 کرانهای حصار درونی را به صورت زیر تعریف می :کنیم کران پایین حصار LIF Q1 1.5 IQRدرونی UIF Q 1.5 IQRکران باالی حصار 3 درونی بنابراین حصار درونی در این مثال به صورت زیر تعریف می شود )( LIF , UIF ) (93.75,145.75 نمودار جعبه ای: :کرانهای حصار بیرونی را به صورت زیر تعریف می کنیم LOF Q1 3IQR ،در نتیجه فاصله زیر ،حصار بیرونی در این مثال است UOF Q3 3IQR )( LOF , UOF ) (75,164.5 گام چهارم تعیین مقادیری از داده ها که در همسایگی کرانهای حصار .درونی است در حقیقت مقادیر این داده ها در حصار درونی قرار دارد و کمینه بیشینه مقدار ممکن از داده ها در حصار درونی است که نزدیک به کران باال و پایین حصار درونی است .همسایگی کران پایین را با نماد LAو همسایگی کران باال را با نماد UAنمایش می دهیم .بنابراین در این مثال، LA 100 UA 140 نمودار جعبه ای: گام پنجم ،تعیین داده های پرت هر داده بیرون از حصار درونی را داده پرت می نامیم .در صورتی که این داده ها بیرون از حصار بیرونی نباشد ،آن را داده پرت معتدل و به جز این .صورت آن را داده پرت غایی می نامیم نمادی که برای نمایش داده های پرت در نمودار جعبه ای به کار خواهیم برد، .دایره توخالی برای داد پرت معتدل و دایره توپر برای داده پرت غایی تیجه در ن داده پرت غایی پایین داده پرت غایی باال UIF<x<UOF X>UOF UOF UIF داده پرت معتدل باال LOF<x<LIF LIF LOF داده پرت معتدل پایین X<LOF نمودار جعبه ای: بنابراین در این مثال داده های پرت عبارتند از92 ،150 ،154 :و 90و داده .پرت غایی نداریم UA UOF 160 Q3 UIF 150 LA 140 130 m 120 IQR Q1 110 LOF LIF 100 90 80
تحقیق و پژوهش • حسابداری • آمار • ریاضی
دانلود پاور پوینت آشنايی با آمار توصيفي
39,000 تومان