تحقیق و پژوهشحسابداری آمار ریاضی

دانلود پاور پوینت آشنايی با آمار توصيفي

آشنايی با آمار توصيفي پيشگفتار: در عصر حاضر كسي نمي‌ تواند منكر این واقعیت باشد كه آمار نقشي الینفک در زندگي روزمره ما بازي مي‌كند .اخبار روزانه رسانه‌هاي گروهی با گزارشی از وضع هوا به پایان مي‌ رسندو در طول اخبار ،به جریانهای بازار بورس و سهام اشاره مي‌شود و روزنامه‌ها خبر از افزایش نرخ اجناس مي‌دهندو... آمار به عنوان پايه يك روش و راه موثر در بررسی مسائل موجود ،در بسیاری از به كار گرفته مي‌شود .در زمينه هاي علمي از جمله جامعه شناسي ،کشاورزی ،فيزيك و‌ .... ‌ دانش امروزي ،معموال سعی مي‌شود كه اطالعات موجود در يك زمينه خاص ،در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطالعات ،فهم بهتری از پدیده مورد به دست آمده و امکان مقایسه فراهم گردد .در يك جمله آمار مجموعه‌اي مطالعه ‌ از روشهای جمع آوری ،تهيه وتنظیم و تجزیه و تحلیل اطالعات است كه براي كسب يك يا چند نتیجه به خدمت گرفته مي‌شود. آمار توصيفي: گيريها جمع آوري ‌ براي اينكه نتايج مناسب و مطلوب از اطالعات كه در آمار مي‌كنيم ،به‌ دست آيد بايد: اعداد نماينده واقعي مشاهدات بوده و غيرواقع يا غلط نباشند به نحو مفيدي تهيه و تنظيم شوند  :به نحو صحيح تجزيه و تحليل گردند آم ا ‏ ر ت قابل نتيجه گيري صحيح باشند و ص ی ف ی روشهايي را كه به وسيله آنها مي‌توان اطالعات جمع‌ آوري ‌ به طور كلي، شده را تنظيم كرده و خالصه نمود ،آمار توصيفي مي‌ناميم و در يك كالم آمار توصيفي عبارت از مجموعه روشهايي است كه پردازش داده‌ها را فراهم ميسازد .اطالع از اصطالحات زير در آمار ضروري است. ‌ اس ون م قي م ن ير ت غ مت عي جم اده زه‌ د دا ان ي ها ه :آمار توصيفي ير گ ي :م ث ا ل : نك ت ه مجموعه افراد يا اشيايي را كه مي‌خواهيم يك يا چند خصوصيت مشترك آنها را مورد بررسی قرار دهيم ،جمعيت يا جمعيت آماري مي‌ناميم. اندازه قد يا وزن دانشجويان بيست ساله يك شهر ،تعداد المپهاي سالم و يا ناسالم توليد شده در يك كارخانه و در يك روز معين، آماري هستند. ‌ مثالهايي از جمعيتهاي معموال مطالعه ويژگي‌هاي مورد نظر ،به هنگامی كه جمعیت آماری بسیار گسترده باشد ،مستلزم صرف هزینه و وقت زيادي مي باشد و در بسیاری از مواقع ،اين امر اصوال امکان پذیر نیست. ‌ بنابراین در چنین موردی ،براي مطالعه ویژگی مورد نظر ،به قسمتی از جمعیت آماری اکتفا مي‌كنيم. اس غي نه قي مت مو م ن ت عي جم اده زه‌ د دا ان ي ها ر آمار توصيفي: نک ت ه : مث ا ل ير گ ي نم و نه قسمتي از جمعيت را كه طبق قاعده و ضوابط خاصي ،براي مطالعه خصوصيتي از جمعيت انتخاب مي‌شود ،يك نمونه از جمعيت مي‌ناميم. اين نمونه وقتي مفيد و قابل قبول خواهد بود كه بتواند نماينده خوبي براي كل جمعيت مورد مطالعه باشد .با توجه به اهميت اين موضوع شاخه‌اي از آمار تحت عنوان نظريه نمونه‌گيري با بررسي نمونه‌اي به اين امر ميپردازد .در بسياري از موارد ،معموال نمونه ‌ مهم تصادفي ساده را در نظر مي‌گيرند. براي بررسی اندازه قد دانشجویان بیست ساله يك شهر ،انتخاب مثال 150نفر از بین اين جمعیت به طور تصادفی ،يا انتخاب 100المپ به تصادف از المپهاي توليدي يك کارخانه در يك روز معین ،براي تعيين كيفيت المپهاي توليدي اين کارخانه مثالهايي از نمونه تصادفی هستند. س يا مق نه مو ن ت عي جم ير گ اده زه‌ د اندا ير تغ هاي م آمار توصيفي: معموال دو نوع متغير در آمار مورد نظر هستند: ‗ متغيرهاي گروهي ،نظير رنگ ،نژاد ،شغل و گروه خوني كه ميباشند. شامل چند گروه يا طبقه ‌ ‗متغيرهاي عددي كه ممكن است نتيجه شمارش باشد ،مانند تعداد احشام هر خانوار در يك روستا‌،تعداد حوادث در يك كارخانه اندازهگيري باشد ،مثل قد ‌ در روزهاي مختلف ،و يا نتيجه دانشجويان بيست ساله در يك شهر ،حجم شربت مولتي ويتامين با استاندارد خاص. ي خصوصیت مورد مطالعه ،از فردی به فرد دیگر ،يا از شي به شي دیگر در جمعیت آماری تغيير مي‌كند ،كه آن را اصطالحا متغير مي‌ناميم. س يا مق نه مو ن ت عي جم ير گ اده زه‌ د اندا ير تغ هاي م آمار توصيفي: متغير‌هاي پیوسته متغير‌هاي عددي كه از راه شمارش بهدست آمده اند ‌ متغيرهايي را كه از طريق اندازه‌گيري به دست آمده باشند ي متغير: متغير‌هاي گسسته متغير‌هاي گروهي ت م نه مو ن ت عي جم زه‌ دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ ي اندازهگيري ویژگی يك متغیر مستلزم آگاهی و ‌ در بسیار از مسائل پيش‌رو‌، شناخت خاصي است .به طور كلي چهار نوع مقیاس براي اندازه گيري وجود دارد: ‏ ‏ ‏ ‏ مقياس اسمي مقياس ترتيبي فاصلهاي ‌ مقياس مقياس نسبتي ت م نه مو ن ت عي جم ير گ مقياس :اسمي ي اين نوع مقياس اندازه‌گيري عمدتا براي طبقه بندي داده‌ها به كار ميرود و منظور از آن اتالق يك عدد طبيعي به داده‌هاي ‌ متفاوت است. :مثال زه‌ دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: گروههاي خوني ‌ اختصاص اعداد 1تا 4به .A,B, AB, O :توجه داشته باشيد كه نميتوان براي مقايسه يا چهار عمل ‌ اين اعداد را اصلي به كار برد ت م نه مو ن ت عي جم زه‌ دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: :مثال در يك كارخانه ممكن است كارگران را به سه دسته ساده ،نيمه ماهر و ماهر تقسيم بندي كنيم .اتالق به ترتيب اعداد 1تا 3به اين سه دسته يك مقياس ترتيبي است. :توجه داشته باشيد كه اين اعداد تنها براي مقايسه به كار مي‌روند و نمي‌توان با آنها چهار عمل اصلي را انجام داد. ير گ دادهها ‌ اندازهگيري عموما براي طبقه بندي ‌ اين نوع مقياس ميرود .به منظور يك نوع برتري به كار ‌ ي مقياس :ترتيبي ت م نه مو ن ت عي جم زه‌ دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ مقياس :فاصله اي ي زمينههاي كه عالوه بر حفظ ترتيب به نحوي فاصله بين ويژگي‌ها ‌ اين نوع مقياس اندارزه‌گيري عموما در را نيز حفظ مي‌كند .به عبارت ديگر در چنين مقياسي نسبت تفاضلها ثابت مي‌ماند. :مثال اندازهگيري ضريب هوشي دانش آموزان كالس اول ‌ .دبستان در شهر اصفهان :توجه داشته باشيد كه در اين نوع مقياس ،عدد صفر يك مفهوم قراردادي است. ت م نه مو ن ت عي جم زه‌ دا ه ان داد ي ها س ا مقي ير غ آمار توصيفي: ير گ ي مقياس :نسبتي ميكند .به عبارت اندازهگيري عالوه بر حفظ فاصله ،نسبت را نيز حفظ ‌ ‌ اين نوع مقياس اندازهگيري ندارد. ‌ اندازهگيري نسبت دو مقدار بستگي به واحد ‌ ديگر در اين نوع اس غي ت قي م م نه مو ن ت عي جم ه داد ير ه‌گ از ند يا ها ر آمار توصيفي: ي ميآيند ،معموال شامل انبوهي عدد يا اطالعاتي كه از مطالعه يك متغير به دست ‌ دادهها را نسبت به نوع متغيري كه ‌ ميناميم. ميباشند كه آنها را داده ‌ عالمت ‌ دادههاي پيوسته تقسيم ‌ ميكنيم به دو دسته داده گسسته و ‌ اندازه گيري ميكنيم. ‌ ده دا خام دادههاي جمع آوري شده كه انبوهي عدد است و ‌ معموال به هيچ نوع پردازشی روي آنها انجام نشده است داده خام ميگويند. ‌ اس غي ت قي م م نه مو ن ت عي جم ه داد ير ه‌گ از ند يا ها ر آمار توصيفي: ي مواردي كه در ارتباط با يك مجموعه از داده‌هاي مي‌بايستي مد نظر عبارتاند از: ‌ داد، قرار ‌ ‗ ‗ خالصه كردن و توضيح داده‌ها به وسيله تنظيم جداول و رسم نمودارها. محاسبه مقادير عددي ،براي دست يافتن به معيارهايي كه تمركز و يا پراكندگي داده‌ها را نشان دهد. دادههاي خام واقعيتهاي موجود را استخراج ‌ در آمار‌،براي اينكه از كنيم،آنها را به نحوي مناسب دسته‌بندي كرده و جدولهايي به نام ‌ مينماييم .متداولترين جدول در آمار ،جدول جدولهاي آماري تهيه ‌ فراواني است. پيش از آنكه نحوه تنظيم جدول فراواني را بيان نماييم‌،اطالع از اصطالحات زير ضروري است. نمودارهاي آماري: معموال داده‌ها را با نمودارهاي مختلف نمايش مي‌دهند .عموما اين نمودارها در آنها ،تجسم ‌ ارتباط با داده‌ هاي پيو.سته به كار گرفته مي شود و منظور از نمايش دادهها است .در اين بخش به معرفي چند نمودار ‌ عيني اطالعات نهفته در معروف اكتفا مي‌كنيم: ‗ هيستوگرام ‗چندبر فراواني ‗چندبر فراواني تجمعي ‗منحنيهاي فراواني و فراواني تجمعي ‗نمايش نمودار تنه و شاخه جعبهاي ‌ ‗نمودار ن چن .....ماي چن دبر منح ش ن دبر ف ني‌ م و ف راو ها دا ر ت را ان ي هي وان ي فر نه او و ست ي ت ج ا ش ن وگ مع ي اخ ر و ا ي نمودارهاي آماري: م ارتفاع هر مستطيل برابر فراواني نسبي عرض مستطيل برابر طول واقعي كالس 24/0 مركز هر مستطيل نماينده كالس 12/0 /3 15 /2 95 /2 75 /2 55 /2 35 /2 15 /1 95 /1 75 /1 55 /1 35 /1 15 04/0 25 ن چن .....ماي دب منح ش ن ر ف ني‌ م هي و ست راو ها دا ر و ا گ ت ن ي رام چن ي ت فر نه دب ج ا و و م ش ر ان فر عي ي اخ ا و و ا ن ي نمودارهاي آماري: 24/0 12/0 /3 05 /2 95 /2 75 /2 55 /2 35 /2 15 /1 95 /1 75 /1 55 /1 35 /1 25 04/0 ن .....ماي منح ش ه چن ن د ن يس بر چندب ي‌ مو د توگ فرا ر هاي ار ت را وان فرا فر نه و ا او و م ي ا ن ش ن ي ت ي اخ ج و نمودارهاي آماري: 00/1 94/0 90/0 مع ي 78/0 62/0 /2 35 08/0 /2 15 /3 05 /2 95 2/0 /1 95 /2 75 44/0 /1 75 /1 55 /1 35 /1 25 /2 55 از اتصال نقاطي كه طول آنها مرز كالس و عرض آنها فراواني نسبي تجمعي تا آن مرز باشد‍ ،يك خط شكسته به دست مي‌آيد كه آن را چندبر فراواني تجمعي مي‌نامند 25 ن چن ماي د چن بر ش . . ف هي دبر را ...م نم و ستو فر وان نحن دا ر گ ا ي ت رام وان تج ي‌ها نه ي مع ي و ش فر ا ا ي خ وا ن ه ي و نمودارهاي آماري: نمودار منحني فراواني 1 نمودار منحني فراواني تجمعي ن چن .... . م دب منح اي ه چن ر ف ني‌ ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه نمودارهاي آماري: *** 4/1 * 5/1 *** 6/1 *** 7/1 ** ****** 8/1 **** ****** 9/1 *** ***** 0/2 ******** **** ½ ***** 2/2 *** 3/2 *** 4/2 *** 5/2 ** 6/2 7/2 8/2 *** 9/2 فرا و ا ن ي ******* *** **** 2 3 4 5 6 7 8 نمودارهاي آماري: نمرات 80دانشجو در امتحانات نهايي درس احتمال و آمار :به شرح زير است 93 76 88 62 90 68 82 75 84 68 75 85 59 71 93 60 73 88 79 73 72 63 78 95 62 74 87 75 65 61 60 68 74 69 77 94 75 82 78 66 71 83 79 60 95 75 61 89 78 99 75 71 65 76 85 78 97 67 62 79 74 50 76 62 78 88 57 73 80 65 77 85 75 76 63 72 81 73 67 86 ن چن .... . م دب منح اي ه چن ر ف ني‌ ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه تنه شاخه 097 5 083520923208177255618 6 74512516569486618728545333558899 7 535858172928046 8 35530479 9 نمودارهاي آماري: ن چن .... . م دب منح اي ه چن ر ف ني‌ ش ن د ر يست بر اوا ها مو د وگ فرا ني ي ف ار ت رام وان تجم راوا نه و ن ي ع ي ش ي ا و خه پس از ساختن نمودار اوليه معموال بهتر است مقادير هر شاخه را از كوچك به بزرگ ،با :تعداد دفعات تكرار‌،مرتب كرد ،به صورت زير 970 5 98 87 655533222211000 6 999888887766665555555444333322111 7 988876555432210 8 97554330 9 مي معيارهاي مركزي: انگي ميا چ ن ن ن نه دكه ما ا با استفاده از جدول فراواني و رسم نمودارها مي‌توانيم داده‌ها را به نحو مطلوبي تنظيم كرده و اطالعات نهفته را تا حدودي مشخص كنيم .با اين حال براي ارايه يك گزارش مناسب‌،بهتر است آنها را در يك يا چند عدد مناسب نيز خالصه كنيم .چنين عددي مي‌تواند معيار مركزي باشد .مهمترين معيارهاي مركزي ميانگين‌ ،ميانه و نما است كه در بخش این به شرح هر يك از آنها خواهيم پرداخت ‌ . نوع x 1 , x 2 , , ‏xk فرض2 k ،با n ،به ‏kاز داده هرگاه ‏y 1 , y 2f,1 , f 2, ,yn , f k ترتيب nبا تعدادهاي ميگوييم. ‌ ‏fi باشندx i،آنگاه ‌ تشكيل شده را فراواني 1 ميانگين= x ‏fx ‏ ‏i i ‏n ‏i=1 حسابي ‏n ‏k ‏ wx ميانگين = ‏w ‏ وزني ‏i ‏i ‏k 1 ‏i=1 ‏k ‏xw ‏i=1 ‏k ميانگين ‏G =(  xif )n هندسي ‏i=1 ‏i كليه داده‌ها بزرگتر از صفر باشند ميا ن گي ن معيارهاي مركزي: چن ن د م كه ا م ا يا ن ه ناميم،اگر ‌ نماييم،عدد mرا ميانه اين داده‌ها مي‌ ‌ اگر داده‌ها را از كوچك به بزرگ مرتب نصف داده‌ها در سمت چپ و نصف داده در سمت راست اين عدد قرار گيرد دادههاي گسسته ‌ محاسبه ميانه براي فرض كنيد ‏y 1 , y 2 , , y n آنها, yرا)(1باy مرتب , y شده(2) , ) (n داده‌هاي ما باشند و شكل نمايش دهيم آنگاه اگر nفرد باشد ) ‏y n 1 2 ( =M اگر nزوج باشد 1 ] [y n  y n )( 1 )2 (2 2 ميا ن گي ن معيارهاي مركزي: چن ن د م كه ا م ا يا ن ه دادههاي پيوسته ‌ محاسبه ميانه براي ‏n 25 2 ‏n ‏ Fb ‏m L m  ( 2 )w ‏fm طو ل رده هر ‏Fi ‏fi ‏xi كالس 4 4 45/1 55/1_35/1 10 6 65/1 75/1_55/1 22 12 85/1 95/1_75/1 31 9 05/2 15/2_95/1 39 8 25/2 35/2_15/2 45 6 2/45 55/2_35/2 47 2 65/2 75/2_55/2 50 3 85/2 95/2_75/2 _ 50 جمع مي معيارهاي مركزي: انگي ميا ن ن ه ن ما چ ند ك چندك يك معيار كلي‌ تر از ميانه است و درعنوان حالت خاص ميانه را نيز در بر ها ميگيرد .اگر pيك عدد حقيقي بين صفر وQ p باشد،آنگاه عدد ‌ يك ‌ ميناميم هر گاه p 100% چندك مرتبه ‌ p داده‌ها سمت چپ و ( 100% )p -1داده‌ها سمت Q p راست را باشند. چندكهاي معروف عبارتند از : چاركها را به ترتيب1باQ ‗ چاركها به ازاي p= 25/0 ، 5/0 ، 75/0به دست مي‌آيند و آنها Q ( Q2 ( Q3 (چارك سوم)نشان چارك دوم) و چارك اول)‌، نماد ‏p ميدهند. ‌ دهكها ‏D1 دهكها به D 2 ازاي D 9p=1/0، 2/0،..... ،9/0 به دست مي‌آيند و آنها را به ترتيب با نماد صدكها (دهك نهم) نشان مي‌دهند. (دهك دوم) ......،و (دهك اول)، ترتيبPبا نماد صدكها به ازاي p=01/0 ،02/0.....،99/0به دست مي‌آيند و آنها را به 1 (صدكP99 دوم).....،و (صدك نود و نهم) نشان مي‌دهند. اول)، (صدكP2 مي معيارهاي مركزي: انگي ميا ن ن ه ن ما چ ند ك ها دادههاي گسسته ‌ محاسبه چندك براي كنيدy 1 , y 2 فرض, , ‏yn آنها ,را) (1باy شده)y (2 مرتب , , داده‌هاي ما باشند و شكل ) y ( n نمايش دهيم .براي محاسبه چندك ) Q p  y( r ‏r ( n  1) p, صحي ح با شد د( n  1) p )Q p (1   ) y ( r )   y ( r 1 ‏r [( n  1) p ],  =(n+1)p-r اش ح نب ص حي مي نمودارهاي آماري: انگي ميا ن ن ه ن ما چ ند محاسبه چندك براي داده‌هاي پيوسته با توجه به ستون فراواني تجمعي در جدول فراواني ،كالسي را كه چندك در آن قرار .دارد مشهص مي‌كنيم )(p) (n 0.25 50 12.5 ‏np  Fb )w ‏f Qp ( Q p LQ p  50 0.25  10 ) 0.2 12 ( Q p 1.75  ك ها ‏Fi ‏fi ‏xi كالس 4 4 45/1 55/1_35/1 10 6 65/1 75/1_55/1 22 12 85/1 95/1_75/1 31 9 05/2 15/2_95/1 39 8 25/2 35/2_15/2 45 6 2/45 55/2_35/2 47 2 65/2 75/2_55/2 50 3 85/2 95/2_75/2 _ 50 جمع نمودارهاي آماري: ميان ميا چن د نه ك گي ها ن دادههاي گسسته ‌ محاسبه نما براي باشد ،نما يا مد ‌ داده‌اي كه فراواني آن نسبت به ديگر داده‌ها بيشتر ناميده مي‌شود و آن را با نماد Mنمايش مي‌دهيم .براي به دست نما ،نخست فراواني داده‌ها را پيدا مي‌كنيم و داده‌اي را كه ‌ آوردن داده، ‌ باشد ،به عنوان نما اختيار مي‌كنيم و اگر دو ‌ فراواني آن بيشتر داراي فراواني يكسان و بيش از ديگر فراواني‌ها باشند‌ ،هر دو را به گوييم ،به شرط آن ‌ عنوان نما اختیار مي‌كنيم و داده‌ها را دو نمايي مي‌ نزولي،كنار هم نباشند .در صورتي كه ‌ كه اين دو داده در يك صف غير نزولي،كنار هم باشند نصف مجموع آنها را ‌ اين دو داده در يك صف غير به عنوان نما اختيار مي‌كنيم .اگر تمام داده داراي فراواني يكسان ميگوييم داده‌ها بدون نما هستند .به ياد داشته باشيد كه نما‌،به باشند‌ ، ‌ عنوان يك معيار تمركز در داده‌هاي گروهي به كار گرفته مي‌شود. ن ما نمودارهاي آماري: ميان ميا چن د گي نه ك ه ا ن مثال :براي داده‌هاي 12 ،11 ،10 ،10 ،9 ،9 ،9 ،7 ،5 ،2 ،2و 18نما برابر M=9 است ،زيرا فراواني داده 9بيش از فراواني ديگر داده‌ها است. مثال :براي داده‌ها 7 ،7 ،7 ،5 ،5 ،4 ،4 ،4 ،3 ،2و ،9دو داده 4و 7به عنوان نما اختيار مي‌ شوند ،زيرا فراواني اين دو داده ،بيش از فراواني داده‌هاي ديگر است. مثال :براي داده‌هاي 15 ،12 ،10 ،8 ،5 ،3و ،16نما وجود ندارد ،زيرا تمام داده‌ها داراي فراواني يكسان هستند. مثال :براي داده‌ها 7 ،7 ،5 ،5 ،5 ،4 ،4 ،4 ،3 ،2و 9دو داده 4و 5را كه داراي گزينيم،اما از آنجا كه اين دو ‌ بيشترين فراواني هستند به عنوان نما بر مي‌ دادند،نصف مجموف دو ‌ داده در يك صف غير نزولي در كنار يكديگر قرار شود ،يعني .M=5/4 ‌ داده به عنوان نما اختيار مي‌ ن ما ميان ميا چن د نه ك گي ها ن نمودارهاي آماري: دادههاي پيوسته ‌ محاسبه تما براي ميشود كه از روي جدول مالحظه ‌ فراواني رده 75/1_95/1داراي بيشترين فراواني است بنابراين به ميگيريم. عنوان رده نما در نظر ‌ ‏d1 ‏ ‏d1  d 2 ‏M L M  18/0-24/0 0.12 ‏0.2 0.12  0.06 12/0-24/0 ‏M 1.75  ‏fi ‏xi كالس 4 08/0 45/1 55/1_35/1 6 12/0 65/1 75/1_55/1 12 24/0 85/1 95/1_75/1 9 18/0 05/2 15/2_95/1 8 16/0 25/2 35/2_15/2 6 12/0 2/45 55/2_35/2 2 04/0 65/2 75/2_55/2 3 06/0 85/2 95/2_75/2 ‏ri 50 00/1 جمع ن ما معيارهاي پراكندگي: با وجود این كه در بسیاری از موارد ،میانگین توصیف نسبتا كاملي از دهد ،اما گاهي وجود اطالعات بیشتر در ‌ مجموعه داده‌ها ارائه مي‌ مورد داده‌ها ضروری است .يك مفهوم مهم در ارتباط با داده‌هاي آنهاست،بدين معني كه اندازه‌گيريها تا چه ‌ آماری‌ ،ميزان تغييرات اندازه از فردي به فرد ديگر يا شيي به شيي ديگر تغيير مي‌كنند .در اين بخش‌ ،به بررسي و محاسبه ميزان تغيرات به عنوان معیارهای پراکندگی خواهيم پرداخت .مهمترین معیارهای پراكندگي عبارتند از دامنه‌ ،ميانگين انحراف ها از میانگین يا از میانه ،ميان دامنه چاركها ‌،دامنه صدكي ،واريانس و انحراف معيار است .عالوه بر مطالب فوق ،در اين بخش داده‌هاي استاندارد و ضريب تغيرات را نيز معرفی خواهیم كرد. اگرچه دامنه يك وسيله ساده براي معيارهاي پراكندگي: اندازه‌گيري اختالف و پراكندگي در يك سري از داده‌ها است ،اما در )y (1بزرگترين ) y ( n دامنه هستند داده كوچكترين و نيست. موارد بيشتر رضايتبخش R  y ‏ ‏y ) (n )(1 داده‌هاي بسيار بزرگ يا بسيار معرف دامنه‌، مانع از آنند انحرافها ميانگين كه 1 k كوچكدر با توجه به اينكه محاسبه| MD x   f i | xi  x انحراف nباشد .در ميزان واقعي از ميانگينi ‏1 كنيم، مربع مي‌ واريانس داده‌ها را واريانس kيك معيار مواردي، چنين آن را دوم مثبت بدين جهت ريشه انحرافها ميانگين همگان MD mبه قبول مورد انحراف f i | x i  |m كه انحراف معيار يا ميانه از ‏i 1 شمارمي‌رود. عنوان يك مي‌ناميم‌ ،به استاندارد اندازه ضريب تغيير عبارت است از دامنه مقياس مبناي بر پراكندگي معيار چاركيIQR Q ‏ ‏Q 3 1 نسبي انحراف معيار در مقايسه با واحد به كار مي‌بريم. بهگيري اندازه‌ ميانگين .ضريب همبستگي صدكي دامنه ‏IPR P90  P10 اندازه‌گيري وابسته نيست و براي مقايسه جمعيتهاي يكسان به كار ‏k ‏k 2 داده‌ 1 1 ها 2 2 2 واريانسs   f i ( x مي‌رود .در مقايسه هر اندازه كه ‏f i x i  x ‏i  x )  ‏n i 1 ‏n i 1 ضريب تغيير ويژگي جمعيتي كمتر ‏k 1 2 باشد‌،ويژگي آن چمعيت بهتر معيار s  انحرافf i ( x ‏ ) i  x ‏n i 1 ارزيابي مي‌شود. ‏s ضريب تغييراتv  ‏x معيارهاي پراكندگي: فراوانيy نمايانگر داده‌هاي خام باشند ،براساس f 1 ‏i تا از جدول اگر ‏f برابرx 2 ، y ,ها f y2 ‏x 1, y تا برابرk است .مي‌xدانيم كه ‏k .......،و xتا برابر , 1 2 ‏n ‏s را كم و بر داده هر از اگر . است داده معيار انحراف و ميانگين ترتيب به و ‏s ‏x تقسيم كنيم ،يعني , i=1, ,k ‏xi  x ‏z ‏ داده‌هاي استاندارد ‏i ‏s ‏f , f , , f آنگاهz 1 , z 2 , , z k 1 2 با فراواني‌هاي به ترتيبk را داده‌هاي استاندارد مي‌ناميم .به سادگي مي‌توان نشان داد كه داده‌هاي استاندارد داراي ميانگين برابر با صفر و واريانس برابر با يك 1هستند و به واحد اندازه‌گيري .بستگي ندارند معيارهاي پراكندگي: چون ، v 1  v 2بنابراين نتيجه مي‌گيريم كه دانشجويان در امتجان دوم نمرات مطلوبتري را كسب كرده‌اند. مقاسه ،ابتدا نمرات دانشجو را استاندارد مي‌كنيم ‌ ب) براي 720  700 20 ‏ 7 7 .چونz 1  z 2 ‏z1  65  60 5 ‏ , 6 6 ‏z1  برخوردار است ،بنابراين نمره آزمون دوم دانشجو د رمقايسه از موقعيت بهتري ‌ معیارهای پراکندگی ‏ ‏ ‏ ‏ ‏ ‏ كردهاند و ‌ فرض كنيد يك دسته از دانشجويان در دو امتحان شركت خالصه نتاسج آزمونها به شرح زير است. آزمون اول :ميانگين نمرات برابر ،60انحراف معيار برابر ،6ماكزيمم نمره از 100 آنمون د.م :ميانگين نمرات ،700انحراف معيار برابر ،7ماكزيمم نمره از 1000 الف -چگونه اين دو نتيجه را با هم مقيسه و ارزيابي مي‌كنيد؟ ب -اگر دانشجويي در آزمون اول نمره 65و در آزمون دوم نمره 720را كسب كرده باشد ،وضعيت دانشجو در كدام آزمون مطلوبتر است؟ حل :الف) با محاسبه ضريب تغيير دو آزمون معلوم مي‌شود كه ‏s 6 1 ‏v1  1  ‏ ‏%10 ‏x 1 60 10 ‏s1 7 1 ‏ ‏ ‏%1 ‏x 2 700 100 ‏v2  منحنيهاي فراواني: نامتقارن /چوله به راست نامتقارن /چوله به چپ پخ منحنيهاي فراواني در طبيعت تنوع زيادي دارند ،اما بسياري از منحنيهاي فراواني تك نمايي يا متقارن هستند يا چوله و يا برجسته و يا پخ .ايده آلترين متقارن ،منحني فراواني نرمال ‌ فراواني منحني نرمالمنحني برجسته استانداد استاندارد است .براي منحنيهاي فراواني كامال ميانگين،ميانه و نما بر هم ‌ متقارن تك نمايي مقادير طبيعت،عموما منحني فراواني ‌ منطبق مي‌شوند .در متقارن ايده آل كمتر يافت مي‌شود و بسياري از منحنيهاي فراواني موجود در طبيعت نامتقارن برجسته يا پخ هستند .ميزان انحراف از تقارن ايده آل را معموال با دو معيار چولگي و برجستگي ميسنجند. ‌ منحنيهاي فراواني: ت يا اس ر به ت مثب ‏M mx ‏M m x چولگ :ي ب ه من چ پ في يا معیار اندازه گیری :چولگی ‏M m x ‏x mM ‏x M ضریب چولگی اول ‏s پیرسن منحنيهاي فراواني: میزان کشیدگی یا پخی منحنی فراوانی را یسبت به منحنی نرمال استاندارد ،برجستگی منحنی فراوانی می نامیم .فرمول زیر را می توان به .عنوان معیار برجستگی به کار برد ) (Q3  Q1 2 k ضریب برحستگی ‏P90  P10 صدکی نشان داده شده است که برای منحنی فراوانی نرمال استاندارد ، k=0.263 بنابراین معموال ضریب برجستگی را به صورت زیر تعریف می کنند: ) (Q3  Q1 2  0.263 k ضریب برحستگی ‏P90  P10 صدکی برحسب آن که این مقدار مثبت یا منفی باشد گوییم منحنی فراوانی .برجسته یا پخ است نمودار جعبه ای: همان گونه که گفته شد ،روشهای نموداری و خالصه کردن داده ها به صورت مقادیر عددی موضوعی اساسی در تجزیه و تحلیلهای آماری است .پیش از این دیدیم که چگونه نمایش نمودار تنه و شاخه را می توان به عنوان ابزاری ساده و مهم در نمایش و استنباط از داده ها به .کار گیریم که چنین نموداری بسیار همانند نمودار هستوگرام بود نموار با ارزش دیگری که برخی از امتیازهای دیگر را در مقایسه با نمودار تنه و شاخه دارد نمودار جعبه ای است که برخی از امتیازهای .دیگر را در مقایسه با نمودار تنه وشاخه دارد نمایش نمودار جعبه ای بر پایه داده های مرتب شده از کوچک به بزرگ .و تعیین میانه ،چارک اول و چارک سوم است نمودار جعبه ای: گام اول ،نمایش نمودار تنه و شاخه 20 9 900 10 9877 66 50 11 999995 12 00 13 0 14 40 15 گام دوم تعیین مکان میان ،چارک اول و ،چارک سوم n  1  24  1 12.5مکان = 2 2 میانه با توجه به مقدار به دست امده میانگین داده های دوازدهم و سیزدهم را به عنوان میانه در نظر می گیریم ،یعنی 118  119 ‏m ‏118 .5 2 نمودار جعبه ای: برای تعیین مکان چارک اول و سوم به صورت زیر عمل می کنیم ‏1 12.5 ‏1 12  1 6 .5 2 ‏ ‏ 2 ‏ ‏مکان 2 میانه ‏ مکان چارکها با توجه به مقدار به دست آمده ،میانگین داده های ششم و هفتم از پایین به نظر می گیریم ،یعنی باال را به ترتیب به عنوان چارک اول و چارک سوم در 110  115 Q1 چارک اول ن کته ‏112 .5 2 125  129 ‏127 Q2 چارک 2 سوم در صورتی که مقادیر به دست آمده در مکانها اعداد صحیح باشند ،داده همان مرتبه به عنوان میانه ،چارک اول و چارک سوم در نظر گرفته می .شود میانه و چارکها به دست آمده در ارایه نمایشی برای نمودار جعبه ای با روش بیان شده در بخش های قبل فرق دارد .در حقیقت معیارهای به دست آ»ده از این روش را هینج می نامند که کمی با معیارهای گفته شده نمودار جعبه ای: گام سوم تعیین دو فاصله به عنوان حصارهای درونی و بیرونی ،است ،نخست دامنه چارکها را محاسبه می کنیم ‏IQR Q3  Q1 125  112 .5 12.5 کرانهای حصار درونی را به صورت زیر تعریف می :کنیم کران پایین حصار LIF Q1  1.5 IQRدرونی UIF Q  1.5 IQRکران باالی حصار 3 درونی بنابراین حصار درونی در این مثال به صورت زیر تعریف می شود )( LIF , UIF ) (93.75,145.75 نمودار جعبه ای: :کرانهای حصار بیرونی را به صورت زیر تعریف می کنیم ‏LOF Q1  3IQR ،در نتیجه فاصله زیر ،حصار بیرونی در این مثال است ‏UOF Q3  3IQR )( LOF , UOF ) (75,164.5 گام چهارم تعیین مقادیری از داده ها که در همسایگی کرانهای حصار .درونی است در حقیقت مقادیر این داده ها در حصار درونی قرار دارد و کمینه بیشینه مقدار ممکن از داده ها در حصار درونی است که نزدیک به کران باال و پایین حصار درونی است .همسایگی کران پایین را با نماد LAو همسایگی کران باال را با نماد UAنمایش می دهیم .بنابراین در این مثال، ‏LA 100 ‏UA 140 نمودار جعبه ای: گام پنجم ،تعیین داده های پرت هر داده بیرون از حصار درونی را داده پرت می نامیم .در صورتی که این داده ها بیرون از حصار بیرونی نباشد ،آن را داده پرت معتدل و به جز این .صورت آن را داده پرت غایی می نامیم نمادی که برای نمایش داده های پرت در نمودار جعبه ای به کار خواهیم برد، .دایره توخالی برای داد پرت معتدل و دایره توپر برای داده پرت غایی تیجه در ن داده پرت غایی پایین داده پرت غایی باال ‏UIF<x<UOF ‏X>UOF ‏UOF ‏UIF داده پرت معتدل باال ‏LOF<x<LIF ‏LIF ‏LOF داده پرت معتدل پایین ‏X<LOF نمودار جعبه ای: بنابراین در این مثال داده های پرت عبارتند از92 ،150 ،154 :و 90و داده .پرت غایی نداریم ‏UA ‏UOF 160 ‏Q3 ‏UIF 150 ‏LA 140 130 ‏m 120 ‏IQR ‏Q1 110 ‏LOF ‏LIF 100 90 80

39,000 تومان