صفحه 1:
دي ماه 1385
صفحه 2:
* معيارهاي خوشه بندي
* الكوريتم هاي خوشه بندي
* ارزيابي نتايج خوشه بندي
* نتیجه گيري ۱
* پیشنهادات وكارهاي آینده
صفحه 3:
7 عدم وجود تعریف بطور سراسري پذیرفته شده
- قرار دادن داده ها در گروه هاي مختلف
* كمينه كردن شباهت بين كروه ها
* بيشينه كردن شباهت درون كروهي
- تعريف خوشه ها توسط الكوريتم خوشه بندي
- محدوده خوشه بندي در وب
1 ) خوشه بندي صفحات وب در دامنه خاص
لا ] خوشه بندي نتایج جستجو
صفحه 4:
* مزاياي خوشه بندي وب
پیش پردازش
7 بهبود جستجو
Se
le ae
- سازمان دهي اطلاعات و ارائه دانش
7 بهبود عملیات خزش وب
صفحه 5:
* چالش هاي خوشه بندي وب
7 معيارهاي خوشه بندي
* چگونگي استفاده از معيارهاي
7 الگوریتم هاي خوشه بندي
* کدام الگوریتم؟ toe
صفحه 6:
صفحه 7:
7 وجود رقابت مانع از برقراري پیوند مناسب مي شود
7 نظرات جانبدارانه در برقراري پیوند
- عدم وجود پیوند در صفحات تازه بوجود آمده
7 پیوند به سايتهاي عمومي
- ارثباط فقط 7 درصد زوج دامنه ها توسط پیوندها
* در نتيجه معيارهاي دیگر
صفحه 8:
"3 ۲ حك RY
؟ ارتباط معيارهاي پيوندي با یکدیگر
عامل اصلی. استفاده از پیوندها -
تاثیر در دقت. *
نقش حاشیه اي هم پيوندي و جفت شدگي 7
تاثیر در يادآوري *
بکارگیری معيارهاي مبتني بر پیوند *
تشکیل بردار با تعداد ابعاد برایر با تعداد پیوندها -
els = محلي و نشدي
- نسبت مقادير هم ييوندي وايا جفت شدكي به كل بيوندهاي خروجي وايا
ورودي
- طول مسيرء توزيع يالها و اشيا وب و ..
صفحه 9:
- انواع اطلاعات
* متن مستندات
* استخراج عنوان. کلمات كليدي, اشکال. جداول و ...
* متن موجود در اطراف پیوند
؟ متن اطراف کلمات جستجو (در نتایج جستجو)
- نمایش گرافي محتوا
* استفاده از عملیات یافتن زیرگراف مشترک براي شباهت
صفحه 10:
* ترکیب محتوا و پیوند: تاکید یا نفی؟
* ارتباط محتوا و پیوند:
7 در درون شعاعي در حدود 3 پیوند
- کلمات: حذف صفحات نویز و درصدي از صفحات که مي توانند
خوشه بتدي مونه
- جفت شدگي: اندازه خوشه (بزرگ) و تعداد خوشه هاي تولید
شده
7 هم پيوندي: درصد از صفحه که خوشه بندي مي شود
صفحه 11:
ess
8 يتم هاي بي
= ۱ 1
pS les های سلسله مراتبی در
Bante Des 3
ae هاي مبتني بر ass
1 = الگوریتم هاي مبتني بر یافتن
الگوریتم هاي مبتني بر تلوري
ee 1
5 الكوريتم هاي ا
a الگوریتم هاي مبتني بر ب
: خوشه بندي ماتريس ا
الكوريتم هاي مبتني بر جكالي
صفحه 12:
* الگوریتم هاي سلسله مراتبي
> نمایش بهتر از دانش به کاربر
- پیچیدگی بالا
- خطا در طول تركيب حریصانه
> استفاده از الگوریتم هاي یک سطحی برای تشکیل خوشه های
اولیه ۱
- انجام چند. گذر برای بهبود سلسله مراتب
صفحه 13:
تعیین تعدادي نقطه (مرکز) و انتساب داده ها به آن
7 تعیین تعدادي مرکز محدود و افزایش تدريجي
7 استفاده از مفاهیم هم پيوندي و جفت شدگي برای تشکیل
خوشه اولیه
- ارتباط با سایر الکوریتم ها
* الگوریتم 171 بر روي تركيبي از > توزیع نرمال
* برش کمینه نرمال شده
صفحه 14:
7 تفاوت و شباهت خوشه و اجتماع
* مفهوم عام تر خوشه نسبت به اجتماع
- استخراج اجتماع با استفاده از خوشه بندی
> سیر شاه یک یار Gee
آپس پردازش جهت کاهش اندازه و يا حذف خوشه ها
Sa ايفاي نقش هسته خوشه ها توسط اجتماعات
صفحه 15:
59 راهكارهاي عمده در توسعه الگوریتم هاي گرافی
- تشکیل خوشه با حذف یالها ۱
* تشکیل درخت پوشاي کمینه گراف و حذف طولاني ترین یال ها
* خوشه بندي مبتني بر مياني بودن
* برش کمینه و برش کمینه نرمال شده
7 استخراج مولفه ها و گروه هاي متصل
* شمارش گروه هاي دوبخشي و محفل ها
* گروه بندي گره هاي مجاور بر اساس
is ی درو
صفحه 16:
* درخت پسوندي
- استفاده از tri
- تشکیل درخت مبتني بر عبارت هاي پسوندي
7 محتواي هر گره
* اتصال برچسبهاي یال هاي موجود در مسیر ريشه تا گره
* مستندات محتوي برچسب گره
ب دو گره در صورت اشتراک بین اعضا
صفحه 17:
eSB tas lt sss
* روش های یادگیری
- بهینه سازي با استفاده از یک تابع تناسب یا هدف
- بهبود كارابي ساير الكوريتم ها (تنظیم پارامترها و .)
* روشها:
- چگالي محلي و چگالي نسبي (شبیه سازي گرم و سرد کردن)
GL! MajorClust: 8 تكراري هر گره به سمت خوشه نزدیک تر
- شبكه هاي عصبي, مدل مارکف مخفي و ... براي بهبود پارامتر
* الگوریتم های مبتنی بر چگالی
- توسعه کم در محیط وب
* مراحل:
- پیط کردن فاصله هاي همسايگي چگال در مجموعه داده ها
= ترکیب آنها براي ایجاد خوشه هاي بزرگ تر
صفحه 18:
* رابطه چند به چند بین خوشه ها و صفحات وب
* بهنگام کردن افزايشي خوشه ها
* محلي بودن روش خوشه بندي
* استفاده از مزاياي وب معنایی
صفحه 19:
* دشوار و معمولا وابسته به کاربرد
" معيارهاي خارجي
- مشی استاندارد طلایی
- مشي وظيفه كرا
- دقت و يادآوري
- انتروبي: بهم بيوستكي دروني خوشه ها
- :1-1۷691076 ترکیب دقت و يادآوري
* معیارهای داخلی
صفحه 20:
* عدم كارايي پیوند تنها
؟ استفاده از متن و پیوند با مقیاس هاي متفاوت
* استفاده از کاهش ابعاد
* امکان انجام الگوریتم هاي مبتني بر چگالي بر روي وب
* قابليت هاي مفید براي خوشه بندي
* معيارهاي ارزيابي
صفحه 21:
* توسعه روش هاي جدید براساس ناحیه هاي چگال و ساختار پيوندي
و متني صفحات وب
- تعمیم الگوریتم هاي مبتني بر چگالي براي تشکیل خوشه هاي سلسله
مراتبي
- تعریف توابع تناسب براي بهبود خوشه بندي
- در نظر گرفتن مقیاس هاي مختلف براي پیوند و متن
- بررسي استفاده از خوشه هاي پيوندي متراکم بعنوان نواحي چگال اولیه
* استفاده از روش هاي يادگيري براي بهبود الگوریتم هاي مبتني بر
جكالي
- تعيين يارامترهاى مناسب براى تعريف نواحى جكال
صفحه 22:
۲ ردان
Aa
توجه و همراهی شما
3
راهنمايي هاي ارزشمند اساتيد ارجمند
دکتر محمد قدسي
صفحه 23:
