خوشه بندی ساختار وب
اسلاید 1: 1خوشه بندي ساختار وب مرتضي حقير چهرقانيدي ماه 1385
اسلاید 2: 2فهرستتعريف مسالهمعيارهاي خوشه بنديالگوريتم هاي خوشه بنديارزيابي نتايج خوشه بندينتيجه گيريپيشنهادات وکارهاي آينده
اسلاید 3: 3تعريف مسالهعدم وجود تعريف بطور سراسري پذيرفته شده قرار دادن داده ها در گروه هاي مختلف کمينه کردن شباهت بين گروه ها بيشينه کردن شباهت درون گروهيتعريف خوشه ها توسط الگوريتم خوشه بنديمحدوده خوشه بندي در وب خوشه بندي صفحات وب در دامنه خاص خوشه بندي نتايج جستجو
اسلاید 4: 4تعريف مساله - ادامهمزاياي خوشه بندي وبپيش پردازشبهبود جستجومبتني بر خوشهخوشه گراسازمان دهي اطلاعات و ارائه دانش بهبود عمليات خزش وب
اسلاید 5: 5تعريف مساله - ادامهچالش هاي خوشه بندي وبمعيارهاي خوشه بنديچگونگي استفاده از معيارهاي مختلف الگوريتم هاي خوشه بنديکدام الگوريتم؟ ارزيابي نتايج خوشه بنديانجام عمليات خوشه بنديخوشه هاوبمعيارخوشه بنديالگوريتم خوشه بندي؟ارزيابي نتايج
اسلاید 6: 6معيارهاي خوشه بنديمعيارهاي مبتني بر پيوند معيارهاي مبتني بر محتوا معيارهاي مبتني بر ساختار معيارهاي ترکيبي
اسلاید 7: 7معيارهاي مبتني بر پيوندپيوند مستقيمهم پيونديجفت شدگيمسائلوجود رقابت مانع از برقراري پيوند مناسب مي شودنظرات جانبدارانه در برقراري پيوندعدم وجود پيوند در صفحات تازه بوجود آمدهپيوند به سايتهاي عموميارتباط فقط 7 درصد زوج دامنه ها توسط پيوندهادر نتيجه معيارهاي ديگر
اسلاید 8: 8معيارهاي مبتني بر پيوند - ادامهارتباط معيارهاي پيوندي با يکديگرعامل اصلي، استفاده از پيوندهاتاثير در دقتنقش حاشيه اي هم پيوندي و جفت شدگيتاثير در يادآوريبکارگيری معيارهاي مبتني بر پيوندتشکيل بردار با تعداد ابعاد برابر با تعداد پيوندهاچگالي محلي و نسبينسبت مقادير هم پيوندي و/يا جفت شدگي به کل پيوندهاي خروجي و/يا وروديطول مسير، توزيع يالها و اشيا وب و ...
اسلاید 9: 9معيارهاي مبتني بر محتوا و ساختارانواع اطلاعاتمتن مستنداتاستخراج عنوان، کلمات کليدي، اشکال، جداول و ...متن موجود در اطراف پيوند متن اطراف کلمات جستجو (در نتايج جستجو)نمايش گرافي محتوااستفاده از عمليات يافتن زيرگراف مشترک براي شباهت
اسلاید 10: 10معيارهاي ترکيبيترکيب محتوا و پيوند: تاکيد يا نفی؟ارتباط محتوا و پيوند:در درون شعاعي در حدود 3 پيوند کلمات: حذف صفحات نويز و درصدي از صفحات که مي توانند خوشه بندي شوند جفت شدگي: اندازه خوشه (بزرگ) و تعداد خوشه هاي توليد شده هم پيوندي: درصد از صفحه که خوشه بندي مي شود
اسلاید 11: 11الگوريتم هاي خوشه بنديالگوريتم هاي سلسله مراتبي در مقابل الگوريتم هاي يک سطحيالگوريتم هاي مبتني بر يافتن نقاط نمايندهالگوريتم هاي مبتني بر يافتن اجتماعاتالگوريتم هاي مبتني بر تئوري گراف هاالگوريتم هاي درختيالگوريتم هاي مبتني بر يادگيريخوشه بندي ماتريس هاي خلوتالگوريتم هاي مبتني بر چگالي
اسلاید 12: 12الگوريتم هاي سلسله مراتبي و يک سطحي الگوريتم هاي سلسله مراتبينمايش بهتر از دانش به کاربرپيچيدگي بالاخطا در طول ترکيب حريصانهاستفاده از الگوريتم هاي يک سطحي براي تشکيل خوشه هاي اوليهانجام چند گذر برای بهبود سلسله مراتب
اسلاید 13: 13الگوريتم هاي مبتني بر يافتن نقاط نماينده تعيين تعدادي نقطه (مرکز) و انتساب داده ها به آنتعيين تعدادي مرکز محدود و افزايش تدريجياستفاده از مفاهيم هم پيوندي و جفت شدگي برای تشکيل خوشه اوليه ارتباط با ساير الگوريتم هاالگوريتم EM بر روي ترکيبي از K توزيع نرمالبرش کمينه نرمال شده
اسلاید 14: 14الگوريتم هاي مبتني بر يافتن اجتماعاتتفاوت و شباهت خوشه و اجتماعمفهوم عام تر خوشه نسبت به اجتماعاستخراج اجتماع با استفاده از خوشه بندیمعيار شباهت يک معيار پيوندي پيش/پس پردازش جهت کاهش اندازه و يا حذف خوشه ها ايفاي نقش هسته خوشه ها توسط اجتماعات
اسلاید 15: 15الگوريتم هاي مبتني بر تئوري گرافراهکارهاي عمده در توسعه الگوريتم هاي گرافي تشکيل خوشه با حذف يالها تشکيل درخت پوشاي کمينه گراف و حذف طولاني ترين يال هاخوشه بندي مبتني بر مياني بودن برش کمينه و برش کمينه نرمال شدهاستخراج مولفه ها و گروه هاي متصلشمارش گروه هاي دوبخشي و محفل هاگروه بندي گره هاي مجاور بر اساس برقراري تطبيق و روابط تناسب
اسلاید 16: 16الگوريتم هاي درختي + ماتريس خلوتدرخت پسوندياستفاده از triتشکيل درخت مبتني بر عبارت هاي پسونديمحتواي هر گره اتصال برچسبهاي يال هاي موجود در مسير ريشه تا گرهمستندات محتوي برچسب گرهترکيب دو گره در صورت اشتراک بين اعضاماتريس خلوتRCMکينگMMD
اسلاید 17: 17الگوريتم هاي مبتني بر يادگيري و چگالیروش های يادگيریبهينه سازي با استفاده از يک تابع تناسب يا هدفبهبود کارايي ساير الگوريتم ها (تنظيم پارامترها و ...)روشها:چگالي محلي و چگالي نسبي (شبيه سازي گرم و سرد کردن):MajorClust انتساب تکراري هر گره به سمت خوشه نزديک ترشبکه هاي عصبي، مدل مارکف مخفي و ... براي بهبود پارامترالگوريتم های مبتنی بر چگالیتوسعه کم در محيط وبمراحل:پيدا کردن فاصله هاي همسايگي چگال در مجموعه داده هاترکيب آنها براي ايجاد خوشه هاي بزرگ تر
اسلاید 18: 18ويژگي هاي تکميلي براي خوشه بندي وبرابطه چند به چند بين خوشه ها و صفحات وببهنگام کردن افزايشي خوشه هامحلي بودن روش خوشه بندياستفاده از مزاياي وب معنايي
اسلاید 19: 19ارزيابي نتايج حاصله از خوشه بندي وبدشوار و معمولا وابسته به کاربردمعيارهاي خارجيمشي استاندارد طلاييمشي وظيفه گرادقت و يادآوريانتروپي: بهم پيوستگي دروني خوشه ها:F-Measure ترکيب دقت و يادآوريمعيارهاي داخلي
اسلاید 20: 20نتيجه گيريعدم کارايي پيوند تنهااستفاده از متن و پيوند با مقياس هاي متفاوتاستفاده از کاهش ابعادامکان انجام الگوريتم هاي مبتني بر چگالي بر روي وبقابليت هاي مفيد براي خوشه بنديمعيارهاي ارزيابي
اسلاید 21: 21پيشنهادات و کارهاي آيندهتوسعه روش هاي جديد براساس ناحيه هاي چگال و ساختار پيوندي و متني صفحات وب تعميم الگوريتم هاي مبتني بر چگالي براي تشکيل خوشه هاي سلسله مراتبي تعريف توابع تناسب براي بهبود خوشه بنديدر نظر گرفتن مقياس هاي مختلف براي پيوند و متن بررسي استفاده از خوشه هاي پيوندي متراکم بعنوان نواحي چگال اوليهاستفاده از روش هاي يادگيري براي بهبود الگوريتم هاي مبتني بر چگاليتعيين پارامترهای مناسب برای تعريف نواحی چگال
اسلاید 22: 22با قدرداني و تشکر ازتوجه و همراهی شماوراهنمايي هاي ارزشمند اساتيد ارجمنددکتر محمد قدسي دکتر حسن ابوالحسني
اسلاید 23: 23؟
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.