صفحه 1:
صفحه 2:
oD و وت
۱0
بسدى شيرق
و ود وا دتري"
صفحه 3:
51 ذاو هكاو IZ
۲ ایجاد و افزایش تعداد پایگاه داده ها:
7 داده وب. تجارت الکترونیک
* تراکنشهای بانک
7 آب وهوا
۳ فروشگاه ها
" ارزان تر و قویتر شدن کامپیوترها
* شدت رقابت قوی برای فراهم کردن بهتر سرویس دهی به مشتری
" وجود پایگاه داده ها برای مدیران. برنامه ریزان» پژوهشگران و- برای
تصمیم گیری های راهبردی» تهیه گزارش های مختلف توصیف
وضعیت جاری خود و...
صفحه 4:
+
ices)
+
و
onan
ص56
anna
aman
anna
,annanp
Gannanp
mad
9
صفحه 5:
over 1 Petabyte
101 7B to 1 Petabyte
11to 100TB
1.1 to 1078
101 GB to 1 Terabyte (TB)
11to 100GB
1.1to 10GB
101 MB to 1 GB
11to 100 MB
1.1to 10 MB
lessthan 1 MB
m Largest2011
™ Largest 2010
0.0% 50% 100% 15.0% 20.0% 25.0%
صفحه 6:
iy وا هکا ی
over 100 PB
11to 100PB
1.1to 10 PB
101 TB to 1 Petabyte
11to 100TB
1.1to10TB
101 GB to 1 Terabyte (TB)
11to 100GB
1.1to 10GB
101 MB to1GB
11to 100 MB
1.1to 10 MB
lessthan 1 MB
صفحه 7:
تمرف داو هکاو ی
" از
=
وجود حجم زیاد داده باعث پنهان ماندن بسیاری از اطلاعات محتوی ن می
شود.
به روشهای جدیدی برای کشف دانش نیاز است.
واه کشف دانش در پایگاه داده ها در اوایل دهه ۸۰ در مراجعه به مفهوم
کلی. گسترده. سطح بالا و به دنبال جستجوی دانش در اطلاعات شکل گرفته
است.
هدف مورد نظر تمامی روشها دست یافتن به دانشی سطح بالا از داده های
سطح پایین (خام) در دادگان های بزرگ می باشد.
11010 يا كشفهلنشاز دادف فرليند يافتريطاهاتو ا لكوهاىمفيد از داهم
را كويند كه دادم كووبهره كيرواز الكوييتمهايىي رلويافترإطاهات
مفید در فرآیند 510 لست
صفحه 8:
تمرف داو هکاو کی
1
« داده کاوی در حقیقت کشف
ساختارهاى جالب توجه. غير
منتظره و با ارزش از داخل مجموعه
وسيعى از داده ها مى باشد و
فعاليتى است كه اساسا با آمار و
تحلیل دقیق داده ها منطبق است»
هند (۱۹۹۸)
صفحه 9:
تمرف داو هکاو ی
0
xX
صفحه 10:
ماوت داو هکاوی « بای و
بازیابی داده۳)) دادهکاوی
معیارها بر اساس ساختار بايكاه داده مشخص مىشود بدون زمینه شناختی از قبل میتواند صورت گیرد
ts همواره زيرمجموعداى ازييكا دده تحليل ١ «١ مرتوان به كلى متقلوت از SL باه اده تحليل باشد
ees = مىتواند به كلى متفاوت از ساختار بليكاه داده تحليل
رای فراینداستخراج داتش نياز بهپاکسازی و فلترینگ داده
پردازش ۰ داده هماتكونه كه ذخيره ميشود بازيابى مئىروى ١ براى فرابتد استخراج دانش نياز يه باكسازى و فيلتر
دقت نتایج کملادفیق با احتمال مشخص
صفحه 11:
و واو هک
سورت ماله
Ce
کارایی
وابستگی به
ساختار داده
a
آمار
اب فرص سیر
oak aM
گسترش آگاهی در مورد پدیده مورد توجه
تنها بر روی حجم داده محدود كارا انث
نیز به ساختارهای مرسوم و کلاسیک ذخیرهسازی
1
اساس جمح آوری 5
داده
گزلرش گیری از
داده انبوه
دقت نتایج
ی
بسيار زمان بر است و یا به کلی چواب نمیدهد
as
کی و ابار
دادهکاوی
عدم نياز به فرضيه و قادر به كشف الكوها
بايين به بالا
کشف اطلاعاتی که مورد توجه نبودهاند
برایداده های بسیربزرگ شکل گرفته
توانایی بهرهگیری از داده نامرتب (نظیر داده اینترنت)
نمونه مرجع مشاهده ای
برایداده های بسيار بزرك شكل كرفته
با احتمال مشخص
صفحه 12:
ثثادت «ادمكاو 1
4ه 3 2 0ا:1:]/:/:_ 5 م ]لا
" اگر تعداد متغیرها بیشتر از ۳ بودلا آمار
° اگر مساله Moy NP-Hard یادگیری ماشین
* اگر مساله در فضای محدود بودلآهوش مصنوعی
" اگر ندانیم که در کدام فضا چه محدودیتی داریم لاداده کاوی
صفحه 13:
تم
crisp S96 0919 Wa
صفحه 14:
وطالب دا هکاوی
صفحه 15:
ومالث دادهکاوی
دشی فلت
صفحه 16:
ومالف دار هکاوی
صفحه 17:
9
لمي مه ل نس
Sibi SELL -
ف
* دادگان گرا
a0
| کشف گروه
0
ييش بينى ارتباط
صفحه 18:
صفحه 19:
سیستمهای پيشنهاددهنده
اقا 0
8 سیستمهای پيشنهاددهنده
سیستمهای پيشنهاد دهنده شخصى
* سيستمهاى ييشنهاد دهنده غير شخصى
*_ سیستمهای پيشنهاددهنده
پالایش مبتنی بر محتوی(19))
7 پالایش مشارکتی (۳))
آمورد توجه بودن سیستمهای پيشنهاد دهنده از سال ۱۹۷۰ میلادی
صفحه 20:
ما ای داد هکاوی
دامنه ابعاد داده
پیچیددگی و همگن بودن داده
کیفیت داده
توزیع داده
" محرمانگی داده
" داده جریانی
سخت افزار و نرم افزار لازم و موق ۱ : 1
a ات ۳ ij tshoal
در دسترس بودن نيروى انسانى مُكمد ]دادم أكاووة i J
ضیف ای مه در إبرارهاة Lae مانند يادكيرى ماقينى و
الگوریتم های ژنتیکی به کار گرفته شذه در فعالیت ای داده کاوی
—
صفحه 21:
2011-2007 ای داد هکاوی Ub wr”
" کثیف بودن داده(چالشی ترین موضوع)
| ارئه دادهکاوی و کاربرد آن به دیگران(جز ۴ چالش اول)
0 سخت بودن دسترسی به داده ها(جز ۴ چالش اول)
Corporate 13% | ae
Data Miners ~ . eos .
0% 20% 40% 60% 80% 100%
"VeryPoor "Poor Neither Strongnor Poor "Strong —_™ Very Strong
صفحه 22:
7
ol HA
* انتشار اطلاعات برای سومندی صاحب داده
7 افزایش قدرت abl,
> رید سرویس بهتر
" جلوگیری از سوه استفاده
7 افزايش سرقت شناسه. کلاه برداری
> نگرانی بیشتر از هرزنامه و هزینه و امنیت
" تعامل بین انتشار و محرمانگی
" نیاز سازمانهای آماری
رایانش ابر
صفحه 23:
۰ <
ce Wat a رعاستث ol HUA
* = =
" موتور جستجوی م۸0
Netflix °
" ترکیب لیست رای دهندگان و بیمه ایالتی-> پرونده پزشکی
دولتمردان
صفحه 24:
ریت مرگ دا
4S 45> As, Warren,Brandeis ' ,0 برلىتنها
ماندرن۰ ۱۸۹)
0 ۷۷: تن مایللفراد ب رلیتعییر]زادلنه شرلیط و حدودیکه خودشان
گرلیشهایشانو یا رفتلیشاندر معرضدید دیگرلنقرار میگیرد.(۱۹۶۷)
1 حقفرد برلیتعییرلینکه چه نوع لطاهاتدر مورد هی
در جات بادللسته اک نترلب کفرد روعلطاهاتش خصیلش(۴ ۱۹۸)
lo Gls ge -Clutterbuck,Cockcraft ! حذف لطلفات
شخصیتشانو نیز درجه لعاز کلنترل معاستفده از لطاهااتش خص تشک
شده برلعهیگرلن
۲ یک ساله اجتماغی و فرهنگی
صفحه 25:
0 7
مرف رای داده
«حریم خصوصی یک فرد حقیفی یا حقوقی: محدودهای است که فرد تمایلی به نمایش اطلاعات
موجود د رآن به صورت کامل, جزنی, با غیر انتخابی توسط خود به همه يا بخش خاصی از اجتماع
ندارد. احترام به حریم خصوصی چنین فردی زمانی تضمین میشود که مادام یکه فرد از قواتین وضع
شده مربوط به آن جامعهی حقیقی يا مجازی تخطی نکند. صرف فعالیت عادی خود و استفاده از
امکانات موجود د رآن جامعه, خود او یا املاک او یا هر نوع خصیصه ی که به نوعی د رارتباط با نخص
اوست, توسط دیگران به صورت غیر انتخابی قابل مشاهده. بازنمایش. پردازش يا انتقال نباشد »4
صفحه 26:
7
اولع رای واه
* فیزیکی
7 جلوگیری از نفوذ به محدوده فیزیکی و تنهایی فرد مانند خانه
" اطلاعاتی
7 نگرانی از نحوه جمع آوری ۰ ذخیره سازی. دسترسی و ارتباط دهی
اطلاعات مربوط به آنها حين اننا و ه طح ر]ى مانن
حریم مالی. اینترنتی» داروبی. سیاسی هنگام رای گیری
" سازمانی
< دولتی و شرکتی-> دسته بندی اطلاعات و محدود کردن دسترسی
1 2
روحی اعقلی
7 جنبه احساسی و رفتاری
صفحه 27:
a ۰
نحت وجرا ى واده
" محرمانگی داده دلیلی است که به امنیت نیاز داریم
" پیچیدگی حفظ حریم خصوصی با دسترسی به اطلاعات
" تعادل بین نیاز امنیتی و حفظ حریم خصوصی
صفحه 28:
رای واوه در اسار واد
۲ در صورت اطمینان کامل به منتشم کنتده
صفحه 29:
137 واوه و ار واوه
memes ار 0
< عدم تخصص منتشر كننده دادهء يردازش داده توسط دريافت كننده
آن انجام مى شود. داده بايد منتشر شود نه نتيجه يردازش روى آن
* منتشر كننده داده دريافت كننده و نوع يردازش را نمى داند
* مهاج بين دریافت کنندگان اطلاعات است
7 اطلاعات تا حد ممکن به واقعیت نزدیک باشد
7 دانش زمینه ای مهاجم محدود است
۲ صاحب داده و منتشر کننده می توانند خصیصه شناسا را از اطلاعات
معموله شناسایی رکنند
صفحه 30:
ونان مازی
" رکورد
۳
جدول
دانش
داده شاسارکد پستی) تما را
صفحه 31:
of ار
" نوع تکی یا چندتایی
" انتشار متوالی: از روی یک جدول اصلی و هرکدام برای یک
عملیات پردازشی خاص منتشر می شود
7 حفظ حریم خصوصی با پیوند
" انتشار حالت پیوسته
" کاربرد کار(پیش بینی» خوشه بندی با )
صفحه 32:
! TranDataMiner.ir
‘ KDNuggets.com
صفحه 33:
