صفحه 1:
به نام خدا
CLUSTERING
ار وختره: اي امیرواز iL
1 اساد ور[ :و مر
صفحه 2:
تعریف خوشه بندی (دسته بندی)
توابع فاصله
انواع روشهای خوشه بندی
۱-5
Db-Scan
یک مثال کاربردی
alee ول جاری ول (Sanat?
صفحه 3:
مجموعه ای از اشیاء که:
.١ اشیاء داخل یک خوشه به یکدیگر شبیه هستند
۲ دوشیع موجود در دو خوشه با یکدیگر تفاوت دارند.
صفحه 4:
+ p= 1: Manhattan-Distance (city block) d(x,
+ p>: Maximum-Metric (x,y) =max{|x,- yj, L< ix d}
ارت تارج ارت
For sets xand y? d_(x,y)=
اس رتم
سکن بول كارى وم یرانسر
صفحه 5:
+ distx, y)>0 (positive semidefinite)
« distx, y) = Oiff x= y (definite) (iff = if and only if)
+ distx, y) = distly, x) (symmetry)
+ If distis a metric, which is often the case:
distx, 2) < dist(x, y) + dist(y, 2) (triangle inequality)
ws 2! هد
Sa nF ول کاری 2 mS |
صفحه 6:
. Partitioning approach
. Density-Based approach
. Hierarchical approach
. Model-Based approach
Ww Ne
sf
lee As ول کاری ae?
صفحه 7:
ابتدا به تعداد > تا خوشه انتخاب می کند (به صورت تصادفی).
مرکز ثقل هر خوشه را محاسبه می کند.
اشیاء را به خوشه ای که کمترین فاصله را با آن ها دارد تخصیص می دهد
به مرحله ی ۲ باز می گردد» تا زمانیکه مراکز ثقل تغس م . کنند اد.. !ند ادامه ادااد,
Henig ds
x,;EC
۳ 7 5
وم یرانسر CHK وس سدق
صفحه 8:
+ reassign
کلاستر را به
روزرسانی
t reassign
هر شى را
نزديكترين
کلاستر
0
Uk به صورت تصادفی
38 LS Glaul das.
A
whe 7)
صفحه 9:
تنها برای داده هایی استفاده می شود. که مرکز ثقل برای آنها قابل تعریف باشد.
در ابتذاى امر باید تنداد خوشه ها را مشخص نمایید.
پیچیدگی زمانی (0)1 که در آن 0 > >]
در مقابل 1 ©11:]لا0ها مقاوم نیست.
نتایج به انتخاب اولیه ی خوشه ها وابسته است.
در کمینه ی محلی گرفتار می شود.
تنها قادر به تشخیص خوشه های محدبی شکل است.
۳ و no
See? ول کاری وم یرانسر
صفحه 10:
صفحه 11:
a(o)= 2 30010062 Pp)
Cla)
b(o) = onl Yaist(o, م
Strong structure 6 هر eC
Medium structure
Weak structure a= b(0)-a(o)
no structure ۱ max {a(o),b(0)}
4
5 بول کاری
0.7> >ءع5 0
0.5< Sc < 0.7
0.25< Sc < 0.5
Sc < 0.25
صفحه 12:
خوشه ها در جاهایی وجود دارنده که چگالی داده ها در آنجا زیاد است.
۰۰
۰
۰ 8 3
MinPts= 5 q isacore abject. ۰
o fo
Core object:
Minpts=4
صفحه 13:
for cach o € D do
if o is not yet classified then
if o is a core-object then
collect all objects density-reachable from 0
and assign them to a new cluster.
else
assign o to NOISE
صفحه 14:
Minpts=3
for cach o € D do
if o is not yet classified then
if o is a core-object then
collect all objects density-reachable from 0
and assign them to a new cluster.
else
assign o to NOISE
صفحه 15:
for cach o € D do
if o is not yet classified then
if o is a core-object then
collect all objects density-reachable from 0
and assign them to a new cluster.
else
assign o to NOISE
صفحه 16:
for cach o € D do
if o is not yet classified then
if o is a core-object then
collect all objects density-reachable from 0
and assign them to a new cluster.
else
assign o to NOISE
صفحه 17:
for cach o € D do
if o is not yet classified then
if o is a core-object then
collect all objects density-reachable from o
and assign them to a new cluster.
else
assign o to NOISE
صفحه 18:
خوشه ها می توانند هرنوع شکلی داشته باشند.
لازم نیست تعداد خوشه ها را مشخص کنید.
نسبت به 6۲لا 0۵ها حساسیت ندارد و آنها را تشخیص می دهد.
تعیین مقدار پارامترهای ورودی مشکل است.
صفحه 19: