علوم پایه آمار

روش های طبقه بندی

صفحه 1:
A REVIEW ON CLASSIFICATION METHODS

صفحه 2:
* تفاوت طبقه بندی و خوشه بندی * مروری بر روش های طبقه بندی 7 روش های آماری و اقتصاد سنجی (پارامتریک) ۷ روش های غیرپارامتریک

صفحه 3:
* داشتن گروه های مشخص * تعریف ویژگی های عضویت در هر گروه * تخصیص هر عضو جدید به گروه های از پیش تعیین شده

صفحه 4:
ی طبقه بندی: گروه های از پیش تعیین شده * خوشه بندی: گروه های از پیش تعیین نشده

صفحه 5:
اين روش ها اقتصادسنجی و آماری می باشند. باشد. اصلی ترین مشکل این روش ها فرضیات موجود در ن ها می این روش ها به دو دسته تقسیم می شوند: 0 تک متغیره 0 من متغیرة

صفحه 6:
نمونه ای از این روش ها عبارتند: 0 Discrimintal Analysis 0 Linear Discrimintal Analysis 0 Quadratic Discrimintal Analysis 0 Linear Probability Model 0 Logit Analysis 0 Probit Analysis

صفحه 7:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۲۵۱ Analysis * بر مبنای اندازه گیری واریانس درون و میان گروهی * رویه : 0 حداکثر کردن واریانس میان 0 حداقل کردن واریانس درون گروه ها

صفحه 8:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۲۵۱ Analysis * فرضیات مورد استفاده: 0 نرمال بودن توزیع متغیرهای پیش بینی © برابر بودن ماتريس واريانس-كوواريانس در بين كروه ها

صفحه 9:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۲۵۱ Analysis * تشکیل تابع ‎‘yj Glee Discrimintal Score‏ بير + ... + وهوررط + رهريرط + یره < برك تخمين مقادير 0 ,3 مطابق زير: (,- ۰)۲ 2۲۱ ررط Gu = — (Be tH)! by /2

صفحه 10:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۲۵۱ Analysis * ماتریس واربانس-کوواریانس: "(ا- زر ۳,(۰6- ر ار ‎x‏ ‏1۵ بو ‎m-q‏ * يك ورودى جديد. در كروه 16ن) قرار مى كيرد اكر براى تمامى كروه هاى ديكرء معادله زيربرقرار باشد: ‎K(k|Dz,‏ 10۱, ها < (ر ).72

صفحه 11:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۲۵۱ Analysis * معایب مدل: - فرضيات مدل - تخمین هزینه ۷۱۱5۱855۴6110۳

صفحه 12:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۵1د0.1 Analysis * اگر ماتریس های واریانس-کوواریانس مساوی نباشند: 7 < 61 bug + DD aiid ‎iat hel‏ از ‏تخمین ها: ( رس - ارر2-- بر - ارت ‎ey‏ ‎۱

صفحه 13:
روش تحلیل تمایزی ۱50۲۱۳۱۱۳۵1د0.1 ‎Analysis‏

صفحه 14:
* با وجود معلیب لین روش ‎LD‏ در صورت صحیح بودن فرضیات. جواب بهینه می دهند. * عدم وجود فرضیات در دنیای واقعی لا کارایی پایین * بخصوص در شرایط زیر: - وجود متغیرهای گسسته - صفات با وابستگی بالا * در نتیجه توسعه مدل های ذکر شده انجام شد.

صفحه 15:
‎Analysis‏ 01۱۱0۷ ۲۵۱02« حعها ‎ ‏* روش ۸۱۵۱۷5۱5 ۳۲۵۵۵۵۲۱۵۷ ۱۲۱062۲ ‏7 بر پایه رگرسیون چند متغیره ‏- تفسير جواب: احتمالی که یک عضو به یک دسته تعلق دارد عیب: مقدار ذکر شده بین * و ۱ نیست!! ‏- استفاده از مدل فوق مشکل می باشد.

صفحه 16:
روش های ۳۳۵۵۲۲ 6 ۲اوویا با وجود قدیمی بودن (دهه ۳۰) کاربرد فراوانی دارند. از نوع تحلیل های اقتصاد سنجی بر پلیه تولبع غیر خطی و تخمین احتمال عضویت اعضا در گروه های مختلف * تفاوت: - استفاده 0011| از توابع منطقی - استفاده ۳۲۵۸ از تابع توزیع تجمعی نرمال

صفحه 17:
روش های ۳۳۵۵۲۲ 6 ۲اوویا * احتمال اینکه یک عضو عضو یک گروه خاص باشد در دو روش: Logit analysis: P, = F(a+g'b)=/(+e*®* ) atgyb Probit analysis: P, = f(a +b) =| A (x)? yr° تخمین پارامترها در این روش: روش حداکثر درستنمایی ad InL= Yn(P,))+ ‏(,ص- )مارج‎ VxyeCy vxjeC,

صفحه 18:
روش های ]۳۳۵۱۵ 6 ]ایا * بهینه سازی ذکر شده غیر-خطی و مشکل است. * _پس تخمین پارامترها : محاسبه احتمال های عضویت * تعیین قوانین با استفاده از منطق * برای مثال, دو گروه داریم, 0.5 مبنای تصمیم گیری

صفحه 19:
* روش های سنتی: دارای فرضیات آماری (مثلا داشتن توزیع متغیرها) * در واقعیت به ندرت این حالت اتفاق می افتد. ۰ ل در نتیجه: ت توسعه مدل هایی که نیازمند تخمین پارامتر نباشند.

صفحه 20:
220000 * منطق فازی برای اولین بار در سال ‎١188‏ توسط لطفى زاده پروفسور علوم کامپیوتر دانشگاه برکلی کالیفرنیا معرفی شد. * در اصل. منطق فازی یک منطق چند مقداره است ولین امکان را فراهم می کند که مقادیر واسطه بین ارزیابی های قراردادی مانند درست‌/غلط. بله/ خيرء زیاداکم و غیره قرار كيرند.

صفحه 21:
* منطق فازی یک ابزار سودمند برای کنترل و راهنمایی سیستم ها و فرآیندهای صنعتی پیچیده است و در زمینه های وسایل برقی خانگی. ابزارهای تفریحی ‏ سیستم های تخصصی و-.کاربرد دارد.

صفحه 22:
® عملکردهای سیستم های فازی 9 S\ LA شکل 3: نمونه ابی از مجموعه های فازی Maa

صفحه 23:
یکی از موارد کاربردی تئوری فازی. طبقه بندی کننده های فازی هستند. در اين جریان, دلنش کارشناسی مورد استفاده قرار گرفته و می تولند.با استفاده از متفیرهای زبانی به صورت طبیعی بیان شود که توسط مجموعه های فازی شرح داده می شوند. حوسط تركيب 8 Re

صفحه 24:
CC en خروجی های فازی برای کل قوانین در یک مجموعه فازی قرار می گیرد. برای تصمیم گیری قطعی از این خروجی فازی» می توان مجموعه فازی را از حالت فازی خارج کرد. چندین روش ( روش های غیر فازی سازی) وجود دارد. یکی از آنها به عنوان مثال گرفتن مرکز ثقل مجموعه فازی است که در شکل ۷ نشان داده شده است كه براى مجموعه هاى فازى كاربرد زيادى دارد.

صفحه 25:
شکل 9: دی فازی شدت یا استفاده از روش مرکر تقل igh ‘inal ‏رصت‎ ع سر هم مه

صفحه 26:
نطق فازی می تولند روش متفاوتی برای کنترل یا طبقه بندی مسئله ارائه کند. عموماء برای مراحل بسیار پیچیده در زمانی که مدل ریاضیاتی ساده ( مانند تبدیل مسائل) برای مراحل غیرخطی یا در زمانی که فرآیند دانش تخصصی (به صورت زبلنی فرمول بندی شده) استفاده می شود. کاربرد منطق فازی می ‎ably ashe alli‏

صفحه 27:
* کر فرهنگ الفت براق ‎ga Hey CHES gg DLs gull ROUGH‏ ادب.متلاطم و ناصاف در نظر گرفته شده است. تكورى مجموعه هاى راف دراوايل سال ۱۹۸۰ میلادی: توسط بروفسورزةيسلاوياولاك. ياية كذارى شذ:

صفحه 28:
این تئوری با تحلیل جدولهای داده سروکار دارد. دراین تئوری جدولهای داده می توانند توسط اندازه گیری یا افراد متخصص وآگاه (خبره)بدست آمده باشد. هدف اصلی از تحلیل مجموعه راف به دست آوردن مفاهیم تقریبی از داده های اکتسابی می باشد, لین تئوری.یک ابزار قدرتمند ریاضی برای استدلال در موارد ابهام و نایقینی است که روشهلیی را برای زدودن و کاستن اطلاعات نامربوط یا مازاد برنیاز از پایگاههای داده ها مهیا می سازد.

صفحه 29:
این فرایند حذف داده های زلئد بر مبنای آموزش, وظیفه اصلی سیستم. وبدون از دست حادن :داده هائ اساسى يايكاه داده ها صورت مى يذيرد. در تعيجه:قليل اظلاعات: مجموعه:اى أر قوامد تلخيض ‎oad‏ و يزمعتا حاضل مى كرددكه كار تصميم كيرنده را بسيار ساده تر مى كند. در حقيقت ميتوان كفت كه مجموعه راق يا كاهش فضاى داده ها وبر كزيدن عبارات مهم يك نكاشت از فضای داده هاى خام به فضاى مفاهيم انجام مى دهد. با تلوری مجموعه های استدلال بولی و تحلیل تفکیکی

صفحه 30:
میتوان از مجموعه راف در حل مسائل اساسی در زمینه تحلیل داده ها استفاده نمود. از جمله: مشخص کردن مجموعه ای از اشیاء‌برحسب مقادیرویژگیها * یافتن وابستگیها بین ویژگیها * زدودن (کاهش یا تقلیل)ویژگیهای مازاد(داده ها) * یافتن مهمترین ویژگیها *_تولید قواعد تصمیم گیری

صفحه 31:
فلسفه مجموعه های راف بر این فرض است که هر شی از جهان را می توان به عنوان اطلاعات(داده.معرفت)در نظر گرفت. رابطه غیر قلیل تشخیص بودن ( رابطه علی- معلولی ) به دست آمده در اين روش اساس ریاضیات تثوری مجموعه های راف می باشد. هر مجموعه ای از اشیاء غیر قلبل تشخیص را یک مجموعه بنیادی می نامند و شکل یک جرء اصلی (اتم) از دانش درباره جهان است. به هر اجتماعی از مجموعه های بنیادی عنوان مجموعه های کریسپ(دقیق) نسبت می دهندو در غیر اینصورت مجموعه مبهم و غیر صریح است که عنوان مجموعه راف برای آن در نظر گرفته می شود.

صفحه 32:
® تثوری مجموعه های راف مبتنی بر مفهوم کلاسه سازی (دسته بندی)است. به عنوان مثال .گروهی از بیماران که از یک بیماری معین رنج می برند رادرنظر بگیریدبا هر بیمربیک فلیل داده ها شامل اطلاعاتی از قبیل نام,آدرسسن. جنسیت. دماى بدن. فشار خون و مانند آن- همراه است.تمام بیمارلنی که علائم مشابهی را نشان می دهند - از نظر اطلاعات دردسترس -مانند یکدیگر هستند.ومی توان آنان را در دسته هایی-به عنوان اجزای بنیادی دانش و معرفت موجودنسبت به بیماران < کلاسه بندی نمود.این اجزاعبه نام مجموعه های بنیادی یا مفاهیم بنیادی شناخته می شوند و میتوانند به عنوان بلوک های سازنده دانش در مورد بیماران در نظر گرفته شوند.

صفحه 33:
* هراجتماعی از مفاهیم بنیادی. مجموعه کریسپ-به معنای مجموعه ای با تعریف و مرز های دقیق - نامیده می شود. وهر مجموعه دیگری که کریسپ نباشد. مجموعه راف -به معنای مجموعه مبهم و نادقیق- شناخته می شود. * یک مجموعه راف است اگر ناحیه مرزی ناتهی داشته باشد. ودرغیر اینصورت. کریسپ

صفحه 34:
ارائه منال - مجموعه های راف * در جدول زیر شش فروشگاه بر حسب چهار ویژگی ۳ وع.0).| توصیف شده است: 3 : کیفیتکااها و لجلر © ‎=P‏ سفن دیا ۲ ‎no | prof‏ : سود ياضر فروشكام » ‎no | Tess‏ : لختیارلتپ رسن‌فروشگامع ۰ ‎oa profit‏ * می توان فروشگاههارا برحسب ویژگیهای مشابهی که دارند دریک کلاس جمع کرد و به عنوان یک زیر مجموعه در نظر گرفت.

صفحه 35:
می توان با توجه به ویژگیهای 00 , بآ همه فروشگاهها را در کلاسهای(زیر مجموعه های) زیرطبقه بندی نمود: {1,2.3} Q:good , L:no {4} Q:ave , L:no {5,6} Q:ave L: yes

صفحه 36:
SCS RS SCs.) تئوری راف کاربردهای زیادی در مهندسی.تحلیل داده های پزشکی. پردازش ‎wg pp‏ دارد . برخی از مزایای کاربردی تلوری مجموعه های راف به صورت زیر می باشد: * یک الگوریتم موثر برای یافتن الگوهای پنهان در داده ها * یافتن مجموعه های مینیمال داده ها (کاهش يا تقلیل داده ها) ارزیابی اهمیت داده ها * تولید مجموعه های مینیمال از قواعد تصمیم گیری از داده ها سادگی فهم و تفسیر آسان نتایج الگوریتم

صفحه 37:
تخراج قواعد با استفاده از مجموعه راف هنگامیکه ارزشهای تلبع تعلق به می باشند. کاربرد مجموعه های راف باکشف کننده ها برای انتخاب خصوصیت(طرح) روشی برای استخراج تغذیه های پایگاه داده ها با استفاده از مجموعه راف ل(کنترل راف) کاربرد مجموعه راف برای داده کاوی درسیستم های اطلاعاتی بیمارستان تحلیل عملی روی مجموعه اطلاعات مراقبت ژنتیک با استفاده از مجموعه راف تولید اتوماتیک داستان با روشهای 1۳لا و مجموعه های راف کلاسه سازی نقطه بهره برداری سیستم قدرت کاربرد تلوری راف در تشخیص خطا در سیستم های قدرت برت فوا

صفحه 38:
۱۳ OT ROS SLR ‎cI‏ معرفت از پست های توزیع ‏استخراج قواعد با تحلیل داده های پزشکی ‏کاهش(فشرده سازی)معرفت در جداول اطلاعاتی(اطلاعات خودروها) ‏تشخیص خطا درسیستم های حمل و نقل ‏کار بر روی هوش پیوندی با استفاده از مجموعه راف ‏استخراج معرفت جاسازی شده در شبکه عصبی تعلیم یافته با استفاده از مجموعه راف ‎GAS‏ روابط بین ویژگیها و وابستگی قواعد با استفاده از مجموعه راف ‏استدلال درباره معرفت با استفاده از مجموعه راف ‏مدلسازی تحلیلی سیستم دما با استفاده از مجموعه راق ‏مدلسازی مجموعه بیماران قلبی موروثی با استفاده از مجموعه راف ‎

صفحه 39:
لیست تشخیصی در یک اتاق اورژانس با استفاده از مجموعه راف کلمات دورافتاده(پرت)زبا. سمی کشور تایلند با استفاده از مجموعه راف بدست آوردن قواعد از اطلاعات ناقص و متناقض با استفاده از مجموعه راف * روشى براى ارزيابى كيفيت در سیستم حمل و نقل با استفاده از مجموعه راف * استفاده از مجموعه راف برای انطباق رهنمودهای بالینی برای سازمانهای مراقب سلامتی

صفحه 40:
ای نوعی مدلسازی ساده انگارانه از سیستم‌های واقعی که كاربرد فراوانى در حل مسائل مختلف در علوم دارند. * حوزه کاربرد این شبکه‌ها آنچنان گسترده است که از کاربردهای طبقه‌بندی گرفته تا کاربردهایی مانند درون‌یابی, تخمین, آشکارسازی و. ۰ . را شامل می‌شود. * شاید مهم‌ترین مزیت این شبکه‌هاء توانایی وافر آنها در کنار سهولت استفاده از آنها باشد. یکی از روش‌های کارآمد در حل مسائل پیچیده شکستن ن به زیرمسأله‌های ساده‌تر است که هر کدام از این زیربخش‌ها به نحو ساده‌تری قابل درک و توصیف باشند.

صفحه 41:
0 شبکه‌ها انواع مختلفی دارند اما همگی آنها از دو گزینه تشکیل می‌شوند: ۱. مجموعه‌ای از گره‌ها: هر گره در حقیقت واحد محاسباتی شبکه است که ورودی‌ها را گرفته و برروی آسن پردازش انجام می‌دهد تا خروجی بدست آید. پردازش انجام شده توسط گره می‌تواند از ساده‌ترین نوع پردازش‌ها نظیر جمع‌کردن ورودی‌ها تا پیچیده‌ترین محاسبات را شامل شود خر خالت ویژه یک گره می توانذ خود«شامل یک غنبکه دیگر باشد. ۲ اتصالات بین گره‌ها: این اتصالات چگونگی گذر اطلاعات بین گره‌ها را مشخص می‌کند. در حالت کلی اتصالات می‌توانند تک سویه یا دوسویه باشند. تعامل بین گره‌ها از طریق اتصالات سبب بروز یک رفتار کلی از سوی شبکه می‌گردد که چنین‌رفتاری به تنهایی هیچ یک از عنصرهای شبکه دیده نمی‌شود. جامع‌بودن این رفتار کلی بر عملکرد موجود در هر گره سبب تبدیل شبکه به یک ابزار توانمند می‌شود.

صفحه 42:
شبکه‌های عصبی با توانایی قابل توجه خود در استنتاج نتایج از داده‌های پیچیده می‌توانند در است ج الگوها و شناسایی گرایش‌های مختلفی که برای انسان‌ها و کامپیوتر شناسایی آنها بسیار دشوار است استفاده شوند. از مزایای شبکه‌های عصبی می‌توان موارد زیر را نام 3 ۱. یادگیری تطبیقی : توانایی یادگیری اينکه چگونه وظایف خود را بر اساس اطلاعات داده شده به آن و یا تجارب اولیه انجام دهد در واقع اصلاح شبکه را گویند. ۲ خود سازماندهی : یک شبکه عصبی مصنوعی به صورت خودکار سازماندهی و ارائه داده‌ایی که در طول آموزش دریافت کرده را انجام دهد. ‎Lass‏ با قاعده یادگیری سازگار شده و پاسخ به ورودى تغيير مى يابد. ۳ عملگرهای بی‌درنگ : محاسبات در شبکه عصبی مصنوعی می‌تواند به صورت موازی و به وسیله سخت‌افزارهای مخصوصی که طراحی و ساخت لن برای دریافت نتلیج بهینه قابلیت‌های شبکه عصبی مصنوعی است انجام شود.

صفحه 43:
۴. تحمل خطا :با ایجاد خرلبی در شبکه مقداری از کارلیی کاهش می‌یلبد هلی برخی امکانات آن با وجود مشکلات بزرگ همچنان حفظ می‌شود. ۵ دسته بندی : شبکه‌های عصبی قادر به دسته بندی ورودی‌ها بر ای دریافت خروجی مناسب می‌باشند. ۶ تعمیمآدهی :ین خاضیت شبکه را قادررمی‌بناوه:تا نها با برهوزد با مداد مخدودی تجونه: یک قانون کلی از لن را به دست آور تعمیم دهد. توانایی که در صورت نبود آن سامانه باید بی نهایت وآقعیت‌ها و روابط را به تناظر يسهازده ۷ پایداری- انعطاف يذيرى : یک شبکه عصبی هم به حد کافی پایدار است تا اطلاعات فراگرفته خود را حفظ کند و هم قابلیت انعطاف و تطبیق را دارد و بدون از دست دادن اطلاعات قبلی نی تزاند مزازد جدود را یذ بره: ‎vo‏ نتایج این آموخته‌ها را به موارد مشاهده از قبل نیز ‎ ‎

صفحه 44:
یک شبکه عصبی شامل اجزای سازنده لایه‌ها و وزن‌ها می‌باشد. در حالت کلی در شبکه‌های عصبی سه نوع لایه نورونی وجود دارد: ‎.١‏ لایه ورودی : دریافت اطلاعات خامی که به شبکه تغذیه شده‌است. ‏۲. لایه‌های پنهان : عملکرد این لایه‌ها به وسیله ورودی‌ها و وزن ارتباط بین آنها و لایه‌های پنهان تعیین می‌شود. وزن‌های بین واحدهای ورودی و پنهان تعیین می‌کند که چه وقت یک واحد پنهان باید فعال شود. ‏۳ لایه خروجی : عملکرد واحد خروجی بسته به فعالیت واحد پنهان و وزن ارتباط بین واحد پنهان و خروجی می‌باشد. ‎

صفحه 45:
شبکه‌های عصبی مصنوعی دارای دامنه کاربرد وسیعی می‌باشند از جمله سامانه‌های آنالیز ریسک. کنترل هواپیما بدون خلبان. آنالیز کیفیست جوشکاری, آنالیز کیفیت کامپیوتر آزمايش اتاق اورثانس. اكتشاف روغن و كازء سامانه‌های ترمز كاميون. 5 ۳ وام. شناسایی طیفی. تشخیص دارو, فرآیندهای کنترل صنعتی, مدير نطاء تشخیص صداء تشخیص هپاتیت. بازیابی اطلاعات راه دور. شناسایی مین‌های ز تشخیص آشیاه سه بعدی او دست نوشته‌ها و چهزه و

صفحه 46:
قواعد یا دستورات مشخصی برای طراحی شبکه جهت یک کاربرد اختیاری وجود ندارد. در مورد مسائل مدل سازی. صرفاً نمی‌توان با استفاده از شبکه عصبی به فیزیک مساله پی برد. به عبارت دیگر مرتبط ساختن پارامترها یا ساختار شبکه به پارامترهای فرآیند معمولاً غیر ممکن است. دقت نتایج بستگی زیادی به اندازه مجموعه آموزش دارد. آموزش شبکه ممکن است مشکل ویا حتی غیر ممکن باشد. پیش بینی عملکرد آینده شبکه (عمومیت یافتن) آن به سادگی امکان پذیر نیست.

صفحه 47:
با تشکر از توجه شما

A REVIEW ON CLASSIFICATION METHODS احسان جهانی محمد حسین بابایی مقدمه • طبقه بندی چیست؟ • تفاوت طبقه بندی و خوشه بندی • مروری بر روش های طبقه بندی روش های آماری و اقتصاد سنجی (پارامتریک) روش های غیرپارامتریک مقدمه • داشتن گروه های مشخص • تعریف ویژگی های عضویت در هر گروه • تخصیص هر عضو جدید به گروه های از پیش تعیین شده تفاوت خوشه بندی و طبقه بندی • طبقه بندی :گروه های از پیش تعیین شده • خوشه بندی :گروه های از پیش تعیین نشده روش های سنتی • این روش ها اقتصادسنجی و آماری می باشند. • اصلی ترین مشکل این روش ها فرضیات موج===ود در آن ها می باشد. • این روش ها به دو دسته تقسیم می شوند: oتک متغیره oچند متغیره روش های سنتی :• نمونه ای از این روش ها عبارتند o Discrimintal Analysis o Linear Discrimintal Analysis o Quadratic Discrimintal Analysis o Linear Probability Model o Logit Analysis o Probit Analysis روش تحلیل تمایزی Discrimintal ‏Analysis • بر مبنای اندازه گیری واریانس درون و میان گروهی • رویه : oحداکثر کردن واریانس میان oحداقل کردن واریانس درون گروه ها روش تحلیل تمایزی Discrimintal ‏Analysis • فرضیات مورد استفاده: oنرمال بودن توزیع متغیرهای پیش بینی oبرابر بودن ماتریس واریانس-کوواریانس در بین گروه ها روش تحلیل تمایزی Discrimintal ‏Analysis • تشکیل تابع Discrimintal Scoreمطابق زیر: • تخمین مقادیر a, bمطابق زیر: روش تحلیل تمایزی Discrimintal ‏Analysis • ماتریس واریانس-کوواریانس: • یک ورودی جدید ،در گروه Ckقرار می گیرد اگر برای تمامی گروه های دیگر ،معادله زیربرقرار باشد: روش تحلیل تمایزی Discrimintal ‏Analysis • معایب مدل: – فرضیات مدل – تخمین هزینه Misclassification روش تحلیل تمایزی Q.Discrimintal ‏Analysis • اگر ماتریس های واریانس-کوواریانس مساوی نباشند: • تخمین ها: روش تحلیل تمایزی Q.Discrimintal ‏Analysis • نمونه حل شده: روش های سنتی • با وجود معایب این روش ها ،در صورت صحیح ب==ودن فرض==یات، جواب بهینه می دهند. • عدم وجود فرضیات در دنیای واقعی کارایی پایین • بخصوص در شرایط زیر: – وجود متغیرهای گسسته – صفات با وابستگی باال • در نتیجه توسعه مدل های ذکر شده انجام شد. روش Linear Probability Analysis • روش Linear Probability Analysis – بر پایه رگرسیون چند متغیره – تفسیر جواب :احتمالی که یک عضو به یک دسته تعلق دارد • عیب :مقدار ذکر شده بین 0و 1نیست!! – استفاده از مدل فوق مشکل می باشد. روش های Logit & Probit • • • • با وجود قدیمی بودن (دهه )30کاربرد فراوانی دارند. از نوع تحلیل های اقتصاد سنجی بر پایه توابع غیر خطی و تخمین احتمال عضویت اعضا در گروه های مختلف تفاوت: – استفاده Logitاز توابع منطقی – استفاده Probitاز تابع توزیع تجمعی نرمال روش های Logit & Probit • احتمال اینکه یک عضو ،عضو یک گروه خاص باشد در دو روش: • تخمین پارامترها در این روش :روش حداکثر درستنمایی روش های Logit & Probit • • • • بهینه سازی ذکر شده غیر-خطی و مشکل است. پس تخمین پارامترها :محاسبه احتمال های عضویت تعیین قوانین با استفاده از منطق برای مثال ،دو گروه داریم P=0.5 ،مبنای تصمیم گیری روش های غیر پارامتریک • روش های سنتی :دارای فرضیات آماری (مثال داشتن توزیع متغیرها) • در واقعیت به ندرت این حالت اتفاق می افتد. • در نتیجه: – توسعه مدل هایی که نیازمند تخمین پارامتر نباشند. تئوری مجموعه های فازی • منطق فازی برای اولین بار در سال 1965توسط لطفی زاده ،پروفسور علوم ک==امپیوتر دانشگاه برکلی کالیفرنیا معرفی شد. • در اصل ،منطق فازی یک منطق چند مقداره است واین امکان را فراهم می کن==د ک==ه مقادیر واسطه بین ارزیابی های قراردادی مانند درست/غلط ،بله /خیر ،زیاد/کم و غیره قرار گیرند. مجموعه های فازی و مجموعه های قطعی • منط==ق ف==ازی ی==ک اب==زار س==ودمند ب==رای کن==ترل و راهنمایی سیس==تم ها و فرآیندهای ص==نعتی پیچی==ده اس==ت و در زمین==ه های وسایل ب==رقی خ==انگی، ابزارهای تفریحی ،سیستم های تخصصی و...کاربرد دارد. عملکردهای سیستم های فازی طبقه بندی های فازی • یکی از موارد کاربردی تئوری فازی ،طبقه بندی کنن==ده های ف==ازی هس==تند .در این جریان ،دانش کارشناسی مورد استفاده قرار گرفته و می تواند با استفاده از متغیرهای زبانی به صورت طبیعی بیان شود که توسط مجموعه های فازی شرح داده می شوند. طبقه بندی های فازی • خروجی های فازی برای کل قوانین در یک مجموعه فازی قرار می گیرد. • برای تصمیم گیری قطعی از این خروجی فازی ،می توان مجموع==ه ف==ازی را از حالت فازی خارج کرد. • چندین روش ( روش های غیر فازی سازی) وجود دارد .یکی از آنها ب==ه عن==وان مثال گرفتن مرکز ثقل مجموعه فازی است ک==ه در ش==کل 7نش==ان داده ش==ده است که برای مجموعه های فازی کاربرد زیادی دارد. طبقه بندی های فازی مجموعه های فازی • منطق فازی می تواند روش متفاوتی برای کنترل یا طبقه بندی مسئله ارائ===ه کند. • عموما ،برای مراحل بسیار پیچیده در زمانی که مدل ریاضیاتی ساده ( مانن==د تبدیل مسائل) برای مراحل غیرخطی یا در زمانی که فرآیند دانش تخصص==ی ( به صورت زبانی فرمول بندی شده) استفاده می شود ،کاربرد منط==ق ف==ازی می تواند مفید باشد. مجموعه های راف • در فرهنگ لغت براي ROUGHمعادلهايي مانن==د زب==ر ،درش==ت ،تقريبي ،بي ادب،متالطم و ناصاف در نظر گرفته شده است. • تئ=====وري مجموع=====ه هاي راف دراوايل سال 1980ميالدي توس=====ط پروفسورزديسالوپاوالك پايه گذاري شد. مجموعه های راف • • • • اين تئوري با تحليل جدولهاي داده سروكار دارد. دراين تئوري جدولهاي داده مي توانند توسط اندازه گيري يا افراد متخصص وآگاه (خبره)بدست آمده باشد. هدف اصلي از تحليل مجموعه راف ب==ه دس==ت آوردن مف==اهيم تقريبي از داده هاي اكتسابي مي باشد. اين تئوري،يك ابزار قدرتمند رياضي براي استدالل در م==وارد ابهام و ن==ايقيني است كه روشهايي را براي زدودن و كاستن اطالعات نامربوط يا مازاد برنياز از پايگاههاي داده ها مهيا مي سازد. مجموعه های راف • اين فرايند حذف داده هاي زائد ،بر مبناي آموزش ،وظيفه اص==لي سيس==تم ،وب==دون از دست دادن داده هاي اساسي پايگاه داده ها صورت مي پذيرد. • در نتيجه تقليل اطالعات ،مجموعه اي از قواع==د تلخيص ش==ده و پرمعن==ا حاص==ل مي گرددكه كار تصميم گيرنده را بسيار ساده تر مي كن==د .در حقيقت ميت==وان گفت كه مجموعه راف با كاهش فضاي داده ها وبر گزيدن عبارات مهم ،يك نگاش==ت از فض==اي داده هاي خام به فضاي مفاهيم انجام مي دهد. تئوري مجموعه راف نقاط اشتراك زيادي با تئوري مجموعه هاي فازي ،تئوري شهود،روش هاي استدالل ب==ولي و تحليل تفكيكي دارد؛ اما تئوري مجموعه راف به عنوان يك تئ==وري مس==تقل در نظر گرفته مي شود. مجموعه های راف ميتوان از مجموعه راف در حل مسائل اساسي در زمينه تحليل داده ها استفاده نمود ،از جمله: • مشخص كردن مجموعه اي از اشياءبرحسب مقاديرويژگيها • يافتن وابستگيها بين ويژگيها • زدودن (كاهش يا تقليل)ويژگيهاي مازاد(داده ها) • يافتن مهمترين ويژگيها • توليد قواعد تصميم گيري مجموعه های راف • • • • فلسفه مجموعه هاي راف بر اين فرض است كه هر شئ از جهان را مي توان به عنوان اطالعات(داده،معرفت)در نظر گرفت. رابطه غير قابل تشخيص بودن ( رابطه علي -معلولي ) ب==ه دس==ت آم==ده در اين روش اساس رياضيات تئوري مجموعه هاي راف مي باشد. هر مجموعه اي از اشياء غير قابل تشخيص را يك مجموعه بنيادي مي نامند و ش==كل يك جرء اصلي (اتم) از دانش درباره جهان است. به هر اجتماعي از مجموعه هاي بنيادي عنوان مجموعه هاي كريسپ(دقيق) نسبت مي دهندو در غير اينصورت مجموعه مبهم و غير صريح است كه عنوان مجموعه راف براي آن در نظر گرفته مي شود. مجموعه های راف • تئوری مجموعه هاي راف مبتني بر مفهوم كالسه سازي (دسته بندي)است. • به عنوان مثال ،گروهي از بيماران كه از يك بيماري معين رنج مي برن===د رادرنظر بگيريد.با هر بيمار،يك فايل داده ها شامل اطالعاتي از قبيل نام،آدرس،سن ،جنسيت، دماي بدن ،فشار خون و مانند آن -همراه اس==ت.تمام بيماراني كه عالئم مش==ابهي را نشان مي دهند – از نظر اطالعات دردسترس –مانند يكديگر هستند،ومي توان آن==ان را در دسته هايي -به عنوان اجزاي بنيادي دانش و معرفت موجودنسبت به بيماران – كالسه بندي نمود.اين اجزاءبه نام مجموعه هاي بنيادي يا مف==اهيم بنيادي ش==ناخته مي شوند و ميتوانند به عنوان بل====وك هاي سازنده دانش در م====ورد بيماران در نظر گرفته شوند. مجموعه های راف • هراجتماعي از مفاهيم بنيادي ،مجموعه كريسپ -به معناي مجموعه اي با تعريف و مرز هاي دقيق -ناميده مي شود ،وهر مجموعه ديگري كه كريسپ نباش==د ،مجموع==ه راف -به معناي مجموعه مبهم و نادقيق -شناخته مي شود. • یك مجموعه راف است اگر ناحيه مرزي ناتهي داشته باشد ،ودرغير اينصورت،كريسپ است. ارائه مثال -مجموعه های راف • در جدول زير شش فروشگاه بر حسب چهار ويژگي Pو L،Q،Eتوصیف شده است: :كيفيت كاالها و اجناسQ :موقعيت رفت و آمد زيادL :سود يا ضرر فروشگاهP :اختيارات پرسنل فروشگاهE • • • • • مي توان فروشگاههارا برحسب ويژگيهاي مشابهي كه دارند دريك كالس جمع كرد و به عنوان يك زير مجموعه در نظر گرفت. ارائه مثال -مجموعه های راف مي توان با توجه به ويژگيهاي L , Qهم==ه فروش==گاهها را در كالس==هاي(زير مجموع==ه هاي) زيرطبقه بندي نمود: {1,2.3} Q:good , L:no {4} Q:ave , L:no {5,6} Q:ave L: yes مزاياي كاربرد تئوري راف تئوري راف كاربردهاي زيادي در مهندسي،تحليل داده هاي پزشكي ،پردازش تص==وير و.... دارد .برخي از مزاياي كاربردي تئوري مجموعه هاي راف به صورت زير مي باشد: • يك الگوريتم موثر براي يافتن الگوهاي پنهان در داده ها • يافتن مجموعه هاي مينيمال داده ها (كاهش يا تقليل داده ها) • ارزيابي اهميت داده ها • توليد مجموعه هاي مينيمال از قواعد تصميم گيري از داده ها • سادگي فهم و تفسير آسان نتايج الگوريتم مثالهاي كاربردي تئوري مجموعه راف • • • • • • • • • استخراج قواعد با استفاده از مجموعه راف هنگاميكه ارزشهاي تابع تعلق ب==ه ص==ورت فواص==لي مي باشند. كاربرد مجموعه های راف باكشف كننده ها براي انتخاب خصوصيت(طرح) روشي براي استخراج تغذيه هاي پايگاه داده ها با استفاده از مجموعه راف كاربرد تئوري راف دركنترل(كنترل راف) كاربرد مجموعه راف براي داده كاوي درسيستم هاي اطالعاتي بيمارستان تحليل عملي روي مجموعه اطالعات مراقبت ژنتيك با استفاده از مجموعه راف توليد اتوماتيك داستان با روشهاي NLPو مجموعه های راف كالسه سازي نقطه بهره برداري سيستم قدرت تشخيص خطا در سيستم هاي قدرت مثالهاي كاربردي تئوري مجموعه راف • • • • • • • • • • استخراج معرفت از پست هاي توزيع استخراج قواعد با تحليل داده هاي پزشكي كاهش(فشرده سازي)معرفت در جداول اطالعاتي(اطالعات خودروها) تشخيص خطا درسيستم هاي حمل و نقل كار بر روي هوش پيوندي با استفاده از مجموعه راف استخراج معرفت جاسازي شده در شبكه عصبي تعليم يافته با استفاده از مجموعه راف كشف روابط بين ويژگيها و وابستگي قواعد با استفاده از مجموعه راف استدالل درباره معرفت با استفاده از مجموعه راف مدلسازي تحليلي سيستم دما با استفاده از مجموعه راف مدلسازي مجموعه بيماران قلبي موروثي با استفاده از مجموعه راف مثالهاي كاربردي تئوري مجموعه راف • • • • • توسعه چك ليست تشخيصي در يك اتاق اورژانس با استفاده از مجموعه راف كالسه سازي كلمات دورافتاده(پرت)زبان رسمي كشور تايلند با استفاده از مجموعه راف بدست آوردن قواعد از اطالعات ناقص و متناقض با استفاده از مجموعه راف روشي براي ارزيابي كيفيت در سيستم حمل و نقل با استفاده از مجموعه راف استفاده از مجموعه راف براي انطباق رهنمودهاي باليني براي سازمانهاي مراقب سالمتي شبکه عصبی • شبکه هاي عصبی نوعی مدلسازي ساده انگاران==ه از سیس==تم‌هاي عصبی واقعی هس==تند ک==ه کاربرد فراوانی در حل مسائل مختلف در علوم دارند. • حوزه کاربرد این شبکه‌ها آنچن==ان گس==ترده اس==ت ک==ه از کاربردهاي طبقه‌بن==دي گرفت==ه ت==ا کاربردهایی مانند درون‌یابی ،تخمین ،آشکارسازي و . . .را شامل می‌شود. • شاید مهم‌ترین مزیت این شبکه‌ها ،توانایی وافر آنها در کن==ار س==هولت اس==تفاده از آنها باش==د. یکی از روش‌هاي کارآمد در حل مسائل پیچیده ،شکستن آن به زیرمسأله‌هاي ساده‌تر اس===ت که هر کدام از این زیربخش‌ها به نحو ساده‌تري قابل درك و توصیف باشند. شبکه عصبی شبکه‌ها انواع مختلفی دارند اما همگی آنها از دو گزینه تشکیل می‌شوند: .1مجموعه‌اي از گره‌ها :هر گره در حقیقت واحد محاسباتی شبکه است که ورودي‌ها را گرفت==ه و برروي آن پردازش انجام می‌دهد تا خروجی بدس==ت آی==د .پ==ردازش انجام ش==ده توس==ط گره می‌تواند از ساده‌ترین نوع پردازش‌ها نظیر جمع‌کردن ورودي‌ها تا پیچی=== ‌ده‌ترین محاسبات را شامل شود .در حالت ویژه ،یک گره می‌تواند خود ،شامل یک شبکه دیگر باشد. .2اتصاالت بین گره‌ها :این اتصاالت چگونگی گذر اطالعات بین گره‌ها را مش===خص می‌کن===د .در حالت کلی اتصاالت می‌توانند تک سویه یا دوس==ویه باش==ند .تعام==ل بین گره‌ها از طری==ق این اتصاالت سبب بروز یک رفتار کلی از سوي شبکه می‌گردد ک==ه چنین‌رفت==اري ب==ه تنهایی در هیچ یک از عنصرهاي شبکه دیده نمی‌شود .جامع‌بودن این رفتار کلی بر عملکرد موج===ود در هر گره سبب تبدیل شبکه به یک ابزار توانمند می‌شود. چرا از شبکه‌های عصبی استفاده می‌شود؟ شبکه‌های عصبی با توانایی قابل توجه خود در استنتاج نتایج از داده‌های پیچیده می‌توانند در استخراج الگوها و شناسایی گرایش‌های مختلفی که برای انسان‌ها و کامپیوتر شناسایی آنها بسیار دشوار است استفاده شوند .از مزایای شبکه‌های عصبی می‌توان موارد زیر را نام برد: .1یادگیری تطبیقی :توانایی یادگیری اینکه چگونه وظایف خود را بر اساس اطالعات داده ش===ده به آن و یا تجارب اولیه انجام دهد در واقع اصالح شبکه را گویند. .2خود سازماندهی :یک شبکه عصبی مصنوعی به صورت خودکار سازماندهی و ارائ===ه داده‌هایی که در طول آموزش دریافت کرده را انجام دهد .نورون‌ها با قاع===ده یادگیری سازگار ش===ده و پاسخ به ورودی تغییر می‌یابد. .3عملگرهای بی‌درنگ :محاسبات در شبکه عصبی مص==نوعی می‌توان==د ب==ه ص==ورت م==وازی و ب==ه وس==یله سخت‌افزارهای مخصوصی که طراحی و ساخت آن برای دریافت نتایج بهینه قابلیت‌های شبکه عصبی مصنوعی است انجام شود. چرا از شبکه‌های عصبی استفاده می‌شود؟ .4تحمل خطا :با ایجاد خرابی در شبکه مقداری از کارایی کاهش می‌یابد ولی برخی امکان==ات آن با وجود مشکالت بزرگ همچنان حفظ می‌شود. .5دسته بندی :شبکه‌های عصبی قادر به دسته بندی ورودی‌ها بر ای دریافت خروجی مناسب می‌باشند. .6تعمیم دهی :این خاصیت شبکه را قادر می‌سازد تا تنها با برخورد با تع==داد مح==دودی نمون==ه، یک قانون کلی از آن را به دست آورده ،نتایج این آموخته‌ها را به موارد مش==اهده از قب==ل ن==یز تعمیم دهد .توانایی که در صورت نبود آن سامانه بای===د بی نهایت واقعیت‌ها و رواب===ط را ب===ه خاطر بسپارد. .7پایداری -انعطاف پذیری :یک شبکه عصبی هم به حد کافی پایدار است تا اطالعات فراگرفت==ه خود را حفظ کند و هم قابلیت انعطاف و تطبیق را دارد و بدون از دست دادن اطالعات قبلی می‌تواند موارد جدید را بپذیرد. ساختار شبکه‌های عصبی یک شبکه عصبی شامل اجزای سازنده الیه‌ها و وزن‌ها می‌باشد. در حالت کلی در شبکه‌های عصبی سه نوع الیه نورونی وجود دارد: .1الیه ورودی :دریافت اطالعات خامی که به شبکه تغذیه شده‌است. .2الیه‌های پنهان :عملکرد این الیه‌ها ب====ه وس====یله ورودی‌ها و وزن ارتباط بین آنها و الیه‌های پنهان تعیین می‌شود .وزن‌های بین واحدهای ورودی و پنهان تعیین می‌کند که چه وقت یک واحد پنهان باید فعال شود. .3الیه خروجی :عملکرد واحد خروجی بسته به فعالیت واح===د پنهان و وزن ارتباط بین واح===د پنهان و خروجی می‌باشد. کاربرد شبکه‌های عصبی شبکه‌های عصبی مصنوعی دارای دامنه کاربرد وسیعی می‌باشند از جمل==ه سامانه‌های آن==الیز ریسک ،کن==ترل هواپیما ب==دون خلبان ،آن==الیز کیفیت جوش==کاری ،آن==الیز کیفیت ک==امپیوتر، آزمایش اتاق اورژانس ،اکتش==اف روغن و گ==از ،سامانه‌های تش==خیص ترمز ک==امیون ،تخمین ریسک وام ،شناسایی طیفی ،تش==خیص دارو ،فرآین==دهای کن==ترل ص==نعتی ،م==دیریت خط==ا، تشخیص صدا ،تشخیص هپاتیت ،بازیابی اطالعات راه دور ،شناسایی مین‌های زیردریایی، تشخیص اشیاء سه بعدی و دست نوشته‌ها و چهره و. . . معایب شبکه‌های عصبی • • • • • قواعد یا دستورات مشخصی برای طراحی شبکه جهت ی==ک ک==اربرد اختیاری وج==ود ندارد. در مورد مسائل مدل سازی ،صرفًا نمی‌توان با اس==تفاده از شبکه عصبی ب==ه فیزی==ک مساله پی ب===رد .ب===ه عبارت دیگر مرتب===ط ساختن پارامترها یا ساختار شبکه ب===ه پارامترهای فرآیند معموًال غیر ممکن است. دقت نتایج بستگی زیادی به اندازه مجموعه آموزش دارد. آموزش شبکه ممکن است مشکل ویا حتی غیر ممکن باشد. پیش بینی عملکرد آینده شبکه (عمومیت یافتن) آن به سادگی امکان پذیر نیست. با تشکر از توجه شما

51,000 تومان