داده کاوی و ضرورت محرمانگی داده
اسلاید 1: داده کاوی و ضرورت محرمانگی داده مهدی نصیری nasiri_m@iust.ac.ir اسفند91
اسلاید 2: چرا داده کاویایجاد و افزایش تعداد پايگاه داده ها: داده وب، تجارت الکترونیکتراکنشهای بانکآب و هوافروشگاه هاارزان تر و قویتر شدن کامپیوترهاشدت رقابت قوی برای فراهم کردن بهتر سرویس دهی به مشتری وجود پايگاه داده ها براي مديران، برنامه ريزان، پژوهشگران و... برای تصميم گيري هاي راهبردي، تهيه گزارش هاي مختلف، توصيف وضعيت جاري خود و...
اسلاید 3: چرا داده کاویفاصله بین دادهتعداد تحلیلگراناندازه داده(ترابایت)
اسلاید 4: چرا داده کاوی
اسلاید 5: چرا داده کاوی
اسلاید 6: تعریف داده کاویوجود حجم زیاد داده باعث پنهان ماندن بسیاری از اطلاعات محتوی آن می شود.نیاز به روشهای جدیدی برای کشف دانش نیاز است.واژه کشف دانش در پايگاه داده ها در اوايل دهه 80 در مراجعه به مفهوم کلي، گسترده، سطح بالا و به دنبال جستجوي دانش در اطلاعات شکل گرفته است. هدف مورد نظر تمامی روشها دست یافتن به دانشی سطح بالا از داده های سطح پایین (خام) در دادگان های بزرگ می باشد. KDD یا کشف دانش از داده، فرآیند یافتن اطلاعات و الگوهای مفید از داده را گویند که داده کاوی بهره گیری از الگوریتمهایی برای یافتن اطلاعات مفید در فرآیند KDD است.
اسلاید 7: تعریف داده کاوی« داده کاوي در حقيقت کشف ساختارهاي جالب توجه، غير منتظره و با ارزش از داخل مجموعه وسيعي از داده ها مي باشد و فعاليتي است که اساساً با آمار و تحليل دقيق داده ها منطبق است» هند (1998)
اسلاید 8: تعریف داده کاوی
اسلاید 9: تفاوت داده کاوی و بازیابی داده
اسلاید 10: تفاوت داده کاوی و آمار
اسلاید 11: تفاوت داده کاوی اگر تعداد متغیرها بیشتر از 3 بود آماراگر مساله NP-Hard بود یادگیری ماشیناگر مساله در فضای محدود بودهوش مصنوعیاگر ندانیم که در کدام فضا چه محدودیتی داریمداده کاوی
اسلاید 12: فرآیند داده کاوی(crisp)
اسلاید 13: وظایف داده کاوی
اسلاید 14: وظایف داده کاویکشف تقلب
اسلاید 15: وظایف داده کاوی
اسلاید 16: شبکه اجتماعی وداده کاویدادگان گرافشاخصهاکشف گروهپیش بینی ارتباط
اسلاید 17: سیتم های پیشنهاد دهنده
اسلاید 18: سيستمهاي پیشنهاددهندهسيستمهاي پیشنهاددهندهسيستمهاي پیشنهاد دهنده شخصيسيستمهاي پیشنهاد دهنده غيرشخصيسيستمهاي پیشنهاددهندهپالایش مبتني بر محتوي(CB) پالایش مشارکتي (CF) مورد توجه بودن سيستمهاي پیشنهاد دهنده از سال 1970 ميلادي19
اسلاید 19: چالش های داده کاویدامنه ابعاد دادهپیچیدگی و همگن بودن دادهکیفیت دادهتوزیع دادهمحرمانگی دادهداده جریانیسخت افزار و نرم افزار لازم و موقعیت بانک اطلاعاتیدر دسترس بودن نیروی انسانی ماهر در داده کاوی ضعف ذاتی نهفته در ابزارهای نظری مثل مانند یادگیری ماشینی و الگوریتم های ژنتیکی به کار گرفته شده در فعالیت های داده کاوی
اسلاید 20: مهمترین چالش های داده کاوی 2007-2011کثیف بودن داده(چالشی ترین موضوع)ارائه داده کاوی و کاربرد آن به دیگران(جز 4 چالش اول)سخت بودن دسترسی به داده ها(جز 3 چالش اول)
اسلاید 21: محرمانگی دادهانتشار اطلاعات برای سومندی صاحب دادهافزایش قدرت رایانهخرید، سرویس بهتر جلوگیری از سوء استفاده افزایش سرقت شناسه، کلاه بردارینگرانی بیشتر از هرزنامه و هزینه و امنیتتعامل بین انتشار و محرمانگینیاز سازمانهای آماریرایانش ابر
اسلاید 22: چند نمونه از عدم رعایت محرمانگی دادهموتور جستجوی AOLNetflixترکیب لیست رای دهندگان و بیمه ایالتی-> پرونده پزشکی دولتمردان
اسلاید 23: تعریف محرمانگی دادهWarren,Brandeis دو وکیل آمریکایی: حق یک فرد برای تنها ماندن(1890)Westin: تمایل افراد برای تعیین آزادانه شرایط و حدودی که خودشان، گرایش هایشان و یا رفتارشان در معرض دید دیگران قرار می گیرد.(1967)Schoeman: حق فرد برای تعیین اینکه چه نوع اطلاعات در مورد وی در حال تبادل است یا کنترل یک فرد روی اطلاعات شخصی اش(1984)Clutterbuck,Cockcraft: حق کاربران برای حذف اطلاعات شخصیتشان و نیز درجه ای از کنترل روی استفاده از اطلاعات شخصی آشکار شده برای دیگرانیک مساله اجتماعی و فرهنگی
اسلاید 24: تعریف محرمانگی داده
اسلاید 25: انواع محرمانگی دادهفیزیکیجلوگیری از نفوذ به محدوده فیزیکی و تنهایی فرد مانند خانهاطلاعاتینگرانی از نحوه جمع آوری ، ذخیره سازی، دسترسی و ارتباط دهی اطلاعات مربوط به آنها حین استفاده از سرویس های اطلاع رسانی مانند حریم مالی، اینترنتی، دارویی، سیاسی هنگام رای گیریسازمانیدولتی و شرکتی-> دسته بندی اطلاعات و محدود کردن دسترسیروحی/عقلیجنبه احساسی و رفتاری
اسلاید 26: امنیت و محرمانگی دادهمحرمانگی داده دلیلی است که به امنیت نیاز داریمپیچیدگی حفظ حریم خصوصی با دسترسی به اطلاعاتتعادل بین نیاز امنیتی و حفظ حریم خصوصی
اسلاید 27: محرمانگی داده در انتشار دادهدر صورت اطمینان کامل به منتشر کننده
اسلاید 28: محرمانگی داده در انتشار دادهچند فرضیهعدم تخصص منتشر کننده داده، پردازش داده توسط دریافت کننده آن انجام می شود. داده باید منتشر شود نه نتیجه پردازش روی آنمنتشر کننده داده دریافت کننده و نوع پردازش را نمی داندمهاجم بین دریافت کنندگان اطلاعات استاطلاعات تا حد ممکن به واقعیت نزدیک باشددانش زمینه ای مهاجم محدود استصاحب داده و منتشر کننده می توانند خصیصه شناسا را از اطلاعات معمولی شناسایی کنند
اسلاید 29: سطوح پنهان سازیرکوردصفت جدولدانشداده شناسا(کد پستی)، نیمه شناسا، حساس و غیرحساس
اسلاید 30: نحوه انتشار نوع تکی یا چندتاییانتشار متوالی: از روی یک جدول اصلی و هرکدام برای یک عملیات پردازشی خاص منتشر می شودحفظ حریم خصوصی با پیوندانتشار حالت پیوستهکاربرد کار(پیش بینی، خوشه بندی یا ...)
اسلاید 31: سایتهای مفیدIranDataMiner.irKDNuggets.com
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.