صفحه 1:
به نام خدا CLUSTERING ار وختره: اي امیرواز ‎iL‏ ‏1 اساد ور[ :و مر

صفحه 2:
تعریف خوشه بندی (دسته بندی) توابع فاصله انواع روشهای خوشه بندی ۱-5 Db-Scan یک مثال کاربردی alee ‏ول جاری ول‎ (Sanat?

صفحه 3:
مجموعه ای از اشیاء که: ‎.١‏ اشیاء داخل یک خوشه به یکدیگر شبیه هستند ۲ دوشیع موجود در دو خوشه با یکدیگر تفاوت دارند.

صفحه 4:
+ p= 1: Manhattan-Distance (city block) d(x, + p>: Maximum-Metric (x,y) =max{|x,- yj, L< ix d} ارت تارج ارت For sets xand y? d_(x,y)= اس رتم سکن بول كارى وم یرانسر

صفحه 5:
+ distx, y)>0 (positive semidefinite) « distx, y) = Oiff x= y (definite) (iff = if and only if) + distx, y) = distly, x) (symmetry) + If distis a metric, which is often the case: distx, 2) < dist(x, y) + dist(y, 2) (triangle inequality) ‎ws 2!‏ هد ‎Sa nF‏ ول کاری 2 ‎mS‏ | ‎ ‎

صفحه 6:
. Partitioning approach . Density-Based approach . Hierarchical approach . Model-Based approach Ww Ne sf lee As ‏ول کاری‎ ae?

صفحه 7:
ابتدا به تعداد > تا خوشه انتخاب می کند (به صورت تصادفی). مرکز ثقل هر خوشه را محاسبه می کند. اشیاء را به خوشه ای که کمترین فاصله را با آن ها دارد تخصیص می دهد به مرحله ی ۲ باز می گردد» تا زمانیکه مراکز ثقل تغس م . کنند اد.. !ند ادامه ادااد, Henig ds x,;EC ۳ 7 5 ‏وم یرانسر‎ CHK ‏وس سدق‎

صفحه 8:
+ reassign کلاستر را به روزرسانی t reassign هر شى را نزديكترين کلاستر 0 Uk ‏به صورت تصادفی‎ 38 LS Glaul das. A whe 7)

صفحه 9:
تنها برای داده هایی استفاده می شود. که مرکز ثقل برای آنها قابل تعریف باشد. در ابتذاى امر باید تنداد خوشه ها را مشخص نمایید. پیچیدگی زمانی (0)1 که در آن 0 > >] در مقابل 1 ©11:]لا0ها مقاوم نیست. نتایج به انتخاب اولیه ی خوشه ها وابسته است. در کمینه ی محلی گرفتار می شود. تنها قادر به تشخیص خوشه های محدبی شکل است. ۳ و ‎no‏ ‎See?‏ ول کاری وم یرانسر

صفحه 10:

صفحه 11:
a(o)= 2 30010062 Pp) Cla) b(o) = onl Yaist(o, ‏م‎ ‎Strong structure 6 ‏هر‎ eC Medium structure Weak structure a= b(0)-a(o) no structure ۱ max {a(o),b(0)} 4 5 بول کاری 0.7> ‏>ءع5‎ 0 0.5< Sc < 0.7 0.25< Sc < 0.5 Sc < 0.25

صفحه 12:
خوشه ها در جاهایی وجود دارنده که چگالی داده ها در آنجا زیاد است. ۰۰ ۰ ۰ 8 3 MinPts= 5 q isacore abject. ۰ o fo Core object: Minpts=4

صفحه 13:
for cach o € D do if o is not yet classified then if o is a core-object then collect all objects density-reachable from 0 and assign them to a new cluster. else assign o to NOISE

صفحه 14:
Minpts=3 for cach o € D do if o is not yet classified then if o is a core-object then collect all objects density-reachable from 0 and assign them to a new cluster. else assign o to NOISE

صفحه 15:
for cach o € D do if o is not yet classified then if o is a core-object then collect all objects density-reachable from 0 and assign them to a new cluster. else assign o to NOISE

صفحه 16:
for cach o € D do if o is not yet classified then if o is a core-object then collect all objects density-reachable from 0 and assign them to a new cluster. else assign o to NOISE

صفحه 17:
for cach o € D do if o is not yet classified then if o is a core-object then collect all objects density-reachable from o and assign them to a new cluster. else assign o to NOISE

صفحه 18:
خوشه ها می توانند هرنوع شکلی داشته باشند. لازم نیست تعداد خوشه ها را مشخص کنید. نسبت به 6۲لا 0۵ها حساسیت ندارد و آنها را تشخیص می دهد. تعیین مقدار پارامترهای ورودی مشکل است.

صفحه 19:

به نام خدا ‏CLUSTERING می م اراهئ دهنده :ا ن ا یدوار کت استاد ردس :د ر مط مباحث رح .1 .2 .3 .4 .5 .6 تعریف خوشه بندی (دسته بندی) توابع فاصله انواع روشهای خوشه بندی ‏K-Means ‏Db-Scan یک مثال کاربردی خوهش بن%دی هوش تجاری کت ع د ر بداهلل 2 تع ی خ ب ر ف وهش ندی مجموعه ای از اشیاء که: .1اشیاء داخل یک خوشه به یکدیگر شبیه هستند .2دوشئ موجود در دو خوشه با یکدیگر تفاوت دارند. خوهش بن%دی هوش تجاری کت ع د ر بداهلل 3 ب توا ع افصله خوهش بن%دی هوش تجاری کت ع د ر بداهلل 4 ب توا ع افصله خوهش بن%دی هوش تجاری کت ع د ر بداهلل 5 انواع روشهای خوهش بندی 1. Partitioning approach 2. Density-Based approach 3. Hierarchical approach 4. Model-Based approach کت ع د ر بداهلل 6 هوش تجاری دی%خوهش بن K-Means .1ابتدا به تعداد Kتا خوشه انتخاب می کند (به صورت تصادفی). .2مرکز ثقل هر خوشه را محاسبه می کند. .3اشیاء را به خوشه ای که کمترین فاصله را با آن ها دارد تخصیص می دهد .4به مرحله ی 2باز می گردد ،تا زمانیکه مراکز ثقل تغییر می کنند این روند ادامه دارد. خوهش بن%دی هوش تجاری کت ع د ر بداهلل 7 K-Means 10 10 9 9 8 8 7 7 6 6 5 5 4 3 2 1 0 10 8 9 6 7 4 5 2 3 0 1 مرکز ثقل هر کالستر Oرا به روزرسانی می کند ‏reassign 10 9 8 7 6 5 4 3 2 1 0 10 9 8 7 6 ‏reassign 5 4 3 2 1 0 هر شی را به نزدOیکترین کالستر تخصیص می دهد 4 3 2 1 0 10 9 8 7 6 5 4 3 2 1 0 10 ‏K=2 9 8 به صورت تصادفی kتا مرکز ثقل انتخاب می کند 7 6 5 4 3 2 1 0 10 9 8 7 6 مکز ثقل هر کالستر Oبه روزرسانی میشود خوهش بن%دی 5 4 3 2 1 0 هوش تجاری کت ع د ر بداهلل 8 K-Means .1تنها برای داده هایی استفاده می شود ،که مرکز ثقل برای آنها قابل تعریف باشد. .2در ابتدای امر باید تعداد خوشه ها را مشخص نمایید. .3پیچیدگی زمانی ) O(tknکه در آن t<<n .4در مقابل outlierها مقاوم نیست. .5نتایج به انتخاب اولیه ی خوشه ها وابسته است. .6در کمینه ی محلی گرفتار می شود. .7تنها قادر به تشخیص خوشه های محدبی شکل است. خوهش بن%دی هوش تجاری کت ع د ر بداهلل 9 ی معا ب K-Means خوهش بن%دی هوش تجاری کت ع د ر بداهلل 10 گی اندازه ری O 0.7< Sc < 1.0 Strong structure 0.5< Sc < 0.7 Medium structure 0.25< Sc < 0.5 Weak structure Sc < 0.25 no structure کت ع د ر بداهلل 11 هوش تجاری دی%خوهش بن Db-Scan خوشه ها در جاهایی وجود دارند ،که چگالی داده ها در آنجا زیاد است. ‏Core object: ‏ ‏Minpts=4 ‏Density reachable: خوهش بن%دی هوش تجاری کت ع د ر بداهلل 12 ‏ Db-Scan خوهش بن%دی هوش تجاری کت ع د ر بداهلل 13 Db-Scan ‏Minpts=3 خوهش بن%دی هوش تجاری کت ع د ر بداهلل 14 Db-Scan خوهش بن%دی هوش تجاری کت ع د ر بداهلل 15 Db-Scan خوهش بن%دی هوش تجاری کت ع د ر بداهلل 16 Db-Scan خوهش بن%دی هوش تجاری کت ع د ر بداهلل 17 Db-Scan .1خوشه ها می توانند هرنوع شکلی داشته باشند. .2الزم نیست تعداد خوشه ها را مشخص کنید. .3نسبت به outlierها حساسیت ندارد و آنها را تشخیص می دهد. .4تعیین مقدار پارامترهای ورودی مشکل است. خوهش بن%دی هوش تجاری کت ع د ر بداهلل 18 ت با شکر از توهج ماش ک ن نان ن رسا جام کار خدایا چنان% ست ر گار خش ن ش تو ود با ی و ما ‏omidvaramin@gmai ‏l.com 19

51,000 تومان