صفحه 1:
201011101
دانش نوين داده كاوى
دكتر جمال شهرابي
عضو هیات علمی دانشکده مهندسی صنایع
دانشگاه صنعتی امیرکبیر
و دبیر کنفرانس داده كاوي ایران
صفحه 2:
* گستردگی روزافزون صنعت. تحولات ایجاد شده در فرهنگ و سلایق
مردم. پیشرفت سریع تکنولویی» بازار رقابتی» همگی لزوم بهره گیری هر
چه بیشتر از دانش داده کاوی_در مدیریت صنایع را ایجاب می کند.
* لزوم بهره برداری از این دانش و منافع حاصل از آن به حدی است که
تمام صنایع را در سراسر دنیا وادار به سرمایه گذاریهای کلان در بسط و
توسعه سیستمهای اطلاعاتی بطور عام و دانش داده کاوی_بطور خاص
نموده است.
صفحه 3:
© ایجاد سیستمهای اطلاعاتی در بستر ۲] نیازمند به کارگیری فن آوریها و راهکارهای
مختلف بر اساس تکنولوژیهای نوین نظیر داده کاوی می باشد.
© داده کاوی به لحاظ ایجاد امکانات منحصر به فرد در سیستمها به سرعت جایگاه خود
را در عوضه ۲] تخبیت کرده و یکی از اجزاء لازم الوجود تمام سیستتهای اطلاعاتی
شده است.
© داده کاوی با پاسخگویی به بسیاری از سئوالات مدیریت. برای مدیران افزایش
راندمان » کاهنش هزینه » امنیت اطلاعات » بهینه سازی پروسه تصمیم گیری ۰
کاهش نیروی انسانی مورد نیاز و از همه مهمتر رضلیت و مشارکت بیشتر شهروندان
زا نه اروك ادقع درق
صفحه 4:
ضرورت داده کاوی
علوم و مهندسی مدرن از اصول پایه ای و قوانین برای توصیف
سیستم ها استفاده می کند و از داده های تجربی برای بررسی صحت
و سقم لين اصول و كاهى تخمين بارامترهايى كه اندازه كيرى دقيق
آنها غير ممكن است استفاده مى
اما رتبقضی ومیته ها اصول بتیادی عاشباته :هسسه ویا سیستم
پیچیده تر از آن است که بتوان آن را فرموله کرد بنابرلین با استفاده
از داده های در دسترس مدل هلیی به وسیله رولبط بین متغیر های
سیستم تولید می شود.
درنتیجه امروزه یک تغییر از مدلسازی کلاسیک که بر اساس اصول
بنیادی بود به مدلسازی پیشرفته و تجزیه و تحلیل مستفیم از داده
به وجود آمد.
صفحه 5:
ضرورت داده کاوی
=
امروزه میزان داده های در دسترس هر 9 سال دو برابر می شوند
و سازمانی توانااست که قادر باشد دانش حداقل 2" درصد از داده
های خود را کاوش نماید.
امروزه سازمان ها از یک سو غرق در داده بوده و از سوی دیگر
از فقر دانش درون داده رنج میبرند.
تصمیم سازان در جمع آوری داده ly در بهره برداری از
دانش درون داده ها برای ساختن تصمیمات صحیح ناتوان هستند.
امروزه حجم شگرفي از داده ها زندگي ما را پر کرده اندکه مدیریت
و تجزیه و تحلیل آنهاً مشکل است و ما در حقیقت از بخش كوچكي از
أنها استفاده مي كنيم زيرا يك.برئاسه كه شامل جكودكي تجزيه و
تحليل آنها باشد وجود ندارد و هميشه تلاش اصلي بر ذخيره سازي
داده ها مي باشد.
صفحه 6:
نتایج یک پژوهش: تاکیدی بر ضرورت داده کاوی <n
2 0096 مدیران معتقدند که داده های بسیار زیاد در حوزه کارشان موجود است.
7 0096 معتقدند که اين وضعیت منجر به خطا می شود.
7 بیش از 90600 مدیران در فرآیندهای تصمیم گیری جاری خود» به دلیل زیادی
داده ها بسیاری از آنهارا نادیده مى كيرند.
7 6696 مديران اين اطلاعات را براى آينده ذخبره می کنند» و آن ها را برای
آنالیزهای جاری بکار نمی برند.
7 60960 معتقدند که هزینه جمع آوری اطلاعات از ارزش مفید آن ها بیشتر
است.
صفحه 7:
داده کاوی چیست؟
توا اس اطلاعات مفید که در داده ها مخفي است و به کار
كرفي أين اطلاعات : در جهان ابتي امروز اهمیت فزاینده اي یافته
است اال و شا و لسر
براي کشف اطلاعات از داده ها داده كاوي نام دارد.
۲ داده كاوي ماهیتا" شبیه به حل يك پازل است. داده ها به صورت تكي
ساده »کامل و قابل توضیح هستند آماً به صورت کلي درکشان سخت
است و داده کاوی راه حل است. ۱
5 تکنولوژی جدید داده کاوی جایگزین روش های پردازش و تفسیر
کلاسیک (هم دستی و هم کامپیوتری) است.
صفحه 8:
اب تکنولوژیک مواجه خواهد ساخت و بدین رو
در سالهای اخیر در دنا گسترش فوق العاده سریعی داشته است.
دانش wale كلو دز سالها كثفته هموازة ان جملهادهادانقن بزتز دتيا بده اسع
دانش داده کاوی فر ایند کشف دانش پنهان درون داده ها است كه با برخورداری
از دامنه وسیع زیر زمینه های تخصصی با توصیف » تشریح ۰ پیش بینی پدیده
های گوناگون پیرامونی» امروزه دارای کاربرد بسیار وسیع در حوزه های
مختلف صنعتی ۰ ارتباطات » کشاورزی » پزشکی »انرژی » علوم اجتماعی ؛
فرهنگی » سیاسی ۰ اقتصادی » بازرگانی ۰ نظامی » مدیربت شهری ۰ آموزشی
sl ... و
صفحه 9:
داده کاوی
اث اتج
٠ داده كاوى عبارت است از كشف روشها و الكوهايى ويه در
بايكاه داده هاى بزرك» براى هدايت تصميم كيرى در مورد فعاليت
هاى آينده.
٠ الكوهاى ارايه شده مى توانند درك مفيد و غير قابل انتظاری در
اختیار یک تحلیل گر داده قرار دهند.
* امروزه مرز و محدودیتی برای کاربرد این دانش متصور نبوده و
زمینه های کاربردی اين دانش در تمامی عرصه های برخوردار
از داده وجود دارد.
صفحه 10:
25 نقش داده کاوي
سس << ات
7 ذخیره ساز داده ها برای هر سازمان مثل یک حافظه عمل می کند ولی حافظه
بدون هوش و آگاهی فایده چندانی ندارد.
7 آگاهی به ما اجازه می دهد در حافظه های قبلی خود جستجو کنیم» به الگوهای
خاصی توجه نمائیم» قوانینی را ایجاد کنیم» به ایده های جدیدی برسیم» سوالهای
درستی را مطرح کنیم و پیش بینی هایی درباره آینده انجام دهیم.
7 تکنیکهای داده کاوی موجب افزایش آگاهی در ذخیره سازی داده ها میشوند.
صفحه 11:
مزاياى داده كاو ى
ae ob 8 5 8 8 25-8
بر فرض هاى ساده كننده مانند فرض استقلال
احتمالى همه يديده ها
دینامیک بودن
آناليزهاى همزمان
عدم نياز به بومى سازى
عدم نياز به اعتبارسنجى
دورى از اشكالات حاصل از نمونه كيرى
عدم نياز به فرضيه
آناليز داده هاى واقعى و نه توزيع داده ها
ايجاد مدل هاى كاملا واقعى
صفحه 12:
سازمان های موفق دنیا:
سازمان های بهره مند از دانش داده کاوی
٠١ "7 نفر اول ثروتمند ترین افراد در امریکا
7 گوگل
" وال مارت
۲ آمازون
۲ ای بی
صفحه 13:
خاستگاه داده کاوی
تجارتهای کوچکی که مدیریت خوبی دارند می توانند به نحوه ایجاد رابطه
با مشتریانشان پی ببرند. آنها با گذشت زمان درباره مشتریانشان به چیزهای
بیشتر و بیشتری پی خواهند برد و از آن دانش برای خدمت بهتر به مشتریان
استفاده خواهند نمود و نتیجه کارء مشتریان وفادار و خرسند و تجارتهای سودآور
خواهد بود.
۲ شرکتهای بزرگ با صدها هزار یا میلیونها نفر مشتری از مزیت برقراری
روابط شخصی حقیقی با تک تک مشتریانشان بی بهره اند. این موسسات عظیم
باید به وسایل دیگری برای برقراری رابطه با مشتریانشان تکیه نمایند. آنها باید
یاد بگیرند که از آنچه که به وفور دارند نهایت بهره را ببرند یعنی داده هایی که
از طریق تعامل با تک تک مشتریان به دست آمده است.
صفحه 14:
خاستگاه داده کاوی
7 دانش نوین داده کاوی با برخورداری از تکنیکهای تحلیلی گسترده؛ برای تبدیل
داده های مشتریان به دانش درباره مشتریان استفاده میشود.
2 تکنیکهای داده گاوی امکان استفاده از انبوه داده هایی را که از طریق تعاملاث با
مشتریان و ارباب رجوعها به منظور شناخت بهتر آنها فراهم شده به شرکتها
میدهد.
صفحه 15:
خاستگاه داده کاوی
و 8 6 5 5
احتمال وفادار ماندن یک مشترى درمورد جه كسى زياد است و احتمالاً جه كسى
وفادار نخواهد بود؟
جه محصولاتى را براى جه مشتريان بالقوه اى بايد عرضه نمود؟
جه جيزى تعيين مى كند كه آيا فرد به محصول خاصى ياسخ مى دهد يا نه؟
جه وقت بايد شعبه بعدى را ايجاد نمود؟
محصول يا خدمات بعدى كه اين مشترى مى خواهد كدام اسث؟
پاسخ به سوالاتى از اين دست در بطن داده هاى هر سازمان قرار دارد وابه
ابزارهاى قوى داده كاوى نياز است تا به آنها رسيد.
ابزار و تكنيهاى داده كاوى بيان شده در اين ارائه در همه زمينه ها و حوزه هاى
ديكر يكسان عمل مى كنند.
صفحه 16:
عوامل توسعه داده کاوی
6 بیشتر تکنیکهای داده کاوی حداقل به عنوان الگوریتمهای آکادمیک از سالها یا دهه های قبل وجود
داشته اند.
6 تنها در دهه اخیر است که داده کاوی تجاری نقش عمده ای را بازی کرده است.
6 اين مسئله به خاطر همزمانی چندین عامل زیر است:
۰ داده ای که ایجاد شده است.
۰ داده ای که ذخیره شده است.
۰ توان محاسباتی قابل دسترسی است.
صفحه 17:
عوامل توسعه داده کاوی
7 داده ای که ایجاد شده است
داده کاوی هنگامی بیشترین معنی را پیدا مى كند كه داده های زیادی وجود
داشته باشد.
۵ اغلب الگوریتم های داده کاوی نیازمند میزان زیادی از داده ها هستند تا
مدلهایی را ترتیب دهند که بعداً برای دسته بندی» تخمین؛ پیش بینی یا سایر
کارکردهای داده کاوی مورد استفاده قرار گیرند.
صفحه 18:
عوامل توسعه داده کاوی
اررربربرببببيبييييُاالااااااالاالاالال ااا ااا تا
© صنايعى نظير مخابرات و كارتهاى اعتبارى به مدت طولانى روابط تعاملى و
اتوماتيك با مشتريان داشته اند و اطلاعات تعاملی زیادی را جمع آوری نموده اند.
8 تنها اخیرا اتوماتیک شدن زندگی روزمره در تمامی زمینه ها بسیار رایج گشته است.
6 امروزه از طرق مختلف داده تولید شده و جمع آوری می شود مانند:
* افزايش ثبت الکترونیک فروش فروشگاهها
»۰ ماشینهای اتوماتیک سخنگو
صفحه 19:
عوامل توسعه داده کاوی
7 داده ای که ذخیره شده است
@ در فرایند ذخیره سازی داده هاء داده ها از منابع بسیار متفاوتی به شکل واحدی
با تعاریف ثابت جمع آوری می گردد.
6 ذخیره ساز داده ها باید بصورت عمده بگونه ای طراحی شود که عمل داده
کاوی را تسهیل نماید.
صفحه 20:
عو 5 توسعد داده کاري
ع نت ] 2“
توان محاسباتی قابل دسترسی است
۵ الگوریتم های داده کاوی معمولاًنیازمند عبور چندگانه از میزان عظیم داده
هاست.
© بيشتر آنها از نظر محاسباتى فشرده هستند.
© کاهش شدید و مداوم در قیمت کامپیوتر انجلم تکنیکهایی را عملى ساخته كه
امروزه با کامپیوتر هلی معمولی نیز قابل انجام است.
صفحه 21:
عوامل توسعه داده کاوی
<<
© ارائه موفق نرم افزارهای مدیریتی پایگاه داده ها از جانب تولید کنندگان عمده
مانند اوراکل» ترادیتا و آی بی ام اين توان را ایجاد کرده که فرآیندهای موازی در
بسیاری از مراکز داده ای شرکتها برای Gals! بار انجام شود.
@ این برنامه سرور پایگاه داده های موازی» فراهم کننده محیط عالی برای داده
کاوی در مقیاس بزرگ می باشد.
صفحه 22:
دستاوردهای پیاده سازی سیستمهای داده کاوی در سازمانها
جربب 5ُ7بببا7 لل لللاااللل ل ار 39
سرعت در تحليل اطلاعات و افزايش كيفيت نتايج تحليل ها
شناسايى سريع فرصتها و تهديدها
بهره كيرى از سيستمهاى داده كاوى با كاربرى آسان
ايجاد امكان استفاده از ابزارهاى متنوع داده كاوى
افزايش قدرت تحليل در سازمان بهمراه افزايش صحت
ايجاد فضايى شفاف در سازمان براى تصميم كيرى صحيح در تمامى رده هاى
مديريتى بويزه بهبود تصميم كيرى مديران ارشد
صفحه 23:
داده کاوی سازماذ
ی
ODM ( Organization Data Mining) ° به عنوان ابزار استخراج
دانش اتکاپذیر از داده ها تعریف شده است.
فن آوری است که فرایند تصمیم گیری را بوسیله دگرگون ساختن داده ها به
سوی دانش ارزشمند درجهت کسب یک مزیت رقابتی سوق می دهد.
a
بعنوان شيوه بكاربردن ابزارهاى داده كاوى تعريف شده است.
يردازش بهينه تصميم كيرى را در سازمان ها تسهيل مى نمايد.
بكار بستن 0101/1 سازمانها را قادر مى سازد تا نسبت به آينده سريع تر عمل
نمايند. فعال باشند بجاى آنكه واكنش يذير باشند و بدانند بجاى آنكه حدس
پزنند
ao
واضع است که با داشتن این قابلیت ».سازمان ها قادر می باشند دانفن
ارزشمندی را از داده هایشان بدست آورند.
صفحه 24:
جایگاه داده کاوی
هدنخ
3
صفحه 25:
مراحل کشف دانش
۱- پاکسازی داده هلد (Data Cleaning
۲- یکپارچه سازی داده ها ۱8۲۵0۲۵10۳ 022)
۳- انتخاب داده ها 561661100 23688 )
(Data Transformation. oslo تبدیل کردن -۴
(Data Mining, داده کاوی -۵
۶-ارزیابی الگو ۴۷۵۱۵۵10۳0 (Pattern
(Knowledge Presentation), jlo i1,-V
صفحه 26:
سیر تاریخی از جمع آوری داده تا داده کاوی
۳
Technolog Celery Data Evolution
7
Computer | How much is the total incom Data collection
Tapes & 2of a person in last year 1960s
Disks ‘
Relational | How many units of a spesific Dala‘Access:
Database product were sold during 1980s
ODBC,SQL ?last month
How many units of a specific
product wore sold dusing Data warehouse DSS
OLAP,DW last month ۳
In comparison with other
?stores
Perofessional
مع نی What will happened in next Data Mining
?month shell Now
processor
computer
صفحه 27:
قدم های بازده گانه داده کاوی
صفحه 28:
قدم های بازده گانه داده کاوی
"" تبدیل مسئله تجارت به مسئله داده کاوی
7" انتخاب داده های مناسب
ل شناخت داده ها
ل تهیه داده های مدل
ل رفع مشکلات با استفاده از داده ها
ل تبدیل داده ها
تهيه مدلها
7 ارزیابی مدلها
7" پیاده سازی مدلها
2 ارزیابی نتایج
صفحه 29:
چرخه تعالی داده کاوی
صفحه 30:
فرایند داده کاوی
teak
re ا
تک ره
Gs اس
تسس
meena cle,
aw
من بیش ید
ییاز
لوب
اراد ۱
صفحه 31:
داده کاوی مکان محور | تکنولوژی اطلاعات مکانی
Gputd Ota Diatay / Bev- IePorwutod Teckolow
ل داده کاوی مکان محور در دهه اخیر هر ساله جزء ده الویت نج ae
بوده است.
نیاز به داشتن آگاهی ازتوزیع مکانی پدیده ها و تعیین میزان وابستگی و تاثیر آنها بر
روی هم. منجر به ایجاد و گسترش داده کاوی مکان محور گشته است.
داده کاوی مکان محور در تمام صنایع و رشته هایی که پدیده ها را می بایست به
صورتی حوزه بندی شده و با در نظر گیری فاکتور" زمان "» "مکان" و یا "زمان- مکان"
بروسبی کنند. استفاده میشود.
7" از آنجا که سیستمهای 2/7) در برگیرنده اطلاعات مکانی و بافت جغرافیاییی شهرها
جاده ها و خیابانها می باشند. با هوشمند نمودن تمامی برنامه های کاربردی به
اطلاعات مکانی- زمانی؛ امکان بهره گیری از داده های مکان محور در این برنامهها نیز
ایجاد میگردد.
صفحه 32:
انواع داده کاوی
© داده کاوی در دو نوع ظاهر می شسود:
© هدايت شده
© غير هدايت شده
© داده كاوى هدليت شده مى خواهد برخى از زمینه های هدف خاص را بیان یا دسته بندى كند.
© هدف داده كاوى غير هدليت شده يافتن الكوهايا تشابهات بين كروههايى از اطلاعات بدون
استفاده از زمينه هدف خاص يا مجموعه اى از دسته هاى از بيش تعيين شده مى باشد.
صفحه 33:
مدل های داده کاوی
داده کاوی عمدتآًبا ساختن مدلها مرتبط است.یک مدل اساسأّبه الگوریتم یا مجموعه ای از
قوانینی گفته می شود که مجموعه ای از ورودی ها رابا هدف ییا مقصد خاصی مرتبط مى
نماید.
© انواع مدل های داده کاوی:
* مدل داده کاوی توصیفی
* مدل داده کاوی تشریحی
* مدل داده کاوی پیش بینی
* مدل داده کاوی کنترلی
صفحه 34:
a
با داده کاوی چه کارهایی می توان انجام داد؟
دسته بندی
دسته بندی شباهت
خوشه بندی
توصیف و نمایه سازی
صفحه 35:
