صفحه 1:
صفحه 2:
لا تعریف پایگاه پردازش تحليلي
1 تفاوت با پایگاه عملياتي
| مشخصات پایگاه پردازش تحلیلی
1 انواع داده در پایگاه پردازش تحليلي
O ساختار پایگا
1 جدول
1غ جدول ابعاد
1غ فرایند طراحي مدل چندبعدي سیستم
MI روش ساخت پایگاه پردازش تحليلي
1 معماري پایگاه پردازش تحليلي
لل نوسازي داده در پایگاه پردازش تحليلي
ه پردازشی تحليلي
صفحه 3:
* 1392 باگهردازش تهلا بايكاه داده اي به منظور تصميم كيري مي باشد
که داراي خصوصیات غیرقابل تغییر. در يك محدوده وسیع زمني, ب یکپارچه و
مبتني بر موضوع مي باشد.
* 1995 مجموعه اي از پایگاه داده هاي یکپارچه. مبتني بر موضوع و بهینه
طراحي شده براي یب از سيستم هاي تصميع باز
* 1996 منبعي كه كاربران نهايي مي توانند در آن به داده هايشان دسترسي بيدا
عرردوو لاقم "لهات
يكي شده حاصل از سيستم هاي عملياتي و
برخی متابع داده خارجی با هدف
اني از تصمیم گيريهاي تجاري.
صفحه 4:
* جامعترین تعریف
- منبع داده جمع آوري شده از داده هاي منابع اطلاعاتي مختلف و حتي ناهمگن
- تحت يك ساختار
7 در يك محدوده وسیع زماني
- با هدف پاسخگوبي به پرسشهاي تحليلي کاربران
صفحه 5:
پوشش دامنه زماني وسیع تر
* يك پایگاه داده یکپارچه حاصل از پردازش چندین پایگاه داده
عملياتي
* قابلیت پاسخگويي به پرسشهاي پيچيدة کاربران و برنامه هاي
كاربردي
صفحه 6:
سازماندهي داده ها بسته به چگونگي ارجاع کاربران
* یکبارچه سازي اسامي
* یکپارچه سازي واحدهاي اندازه گيري متفیرها
پارچه سازي ساختارهاي رمز نگاري
فیلد جنسیت با (0 و ) یا (0 و 1) یا (او ۲ یا (عطساو علس)
* حذف ناسازگاریها و اطلاعات متاقض
* داده هاي یکپارچه
* غیر قابل
داده هاي فقط خواندني
صفحه 7:
محدوده وسیع زماني
* محیط هاي عملياتي گستره زماني 90-60 روز
* پایگاه پردازش تحليلي گستره زماني 10-5 سال
خلاصه شده
* داده هاي تحليلي مناسب براي تصمیم گیریها
حجیم
* به علت محدوده وسیع زمانی
نرمال نشده
* امکان وجود افزونگي
7
صفحه 8:
* داده جاری
داده هاي فعلي منابع عملياتي
داده قدیمی
* داده هاي قديمي منابع اطلاعاتي
داده خلاصه شده
* فرمت فشردة اطلاعات موجود شامل اطلاعات نتایج
" فراداده
* اطلاعات مربوط به داده ها
* ديكشنري از اطلاعات پایگاه
* راهنمايي جهت نگاشت داده از محيطعملياتي به محیط پایگاه پردازش تحليلي
* قوانین استفاده شده براي خلاصه سازي
صفحه 9:
* پاسخ هر پرسش شامل تعداد زيادي رکورد است که در تعداد سطرهاي کمي براي
کاربران ارائه مي شوند.
* کلید اصلي هر جدول ترکیب کليدهاي خارجي جداول ایعاد مي باشد.
تست
بیج
اسیمسص)
9()
Ouccber
price
صفحه 10:
ao
* جدول ابعاد
* توصیف متني بعدهاي تجارت
* پایگاه داده خوب > هر بعد داراي چند ويژگي > ویژگیها متني و گسسته
Ovstoer-d
Ove
1
اس
hear
color
sie
جاده
اس
Oty
Ort
Ove:
peter
ver
صفحه 11:
a
۳
امس(
سوه(
6
Hea
لبم
Gtoreid
Ovstower-d
Crore
Cy
Octe
Orcs
صفحه 12:
انتخاب فرایند تجاري
* فرایند عملياتي اصلي سازمان
* سیستم فروش, سیستم خرید و ...
* انتخاب دانه
* ركوردي از جدول حقیقت
* انتخاب بعد
* مثل زمان. محصول. مشتري و ..
* انتخاب حقایق قابل اندازه گيري جدول حقایق
* مقادیر شمارشي و افزودني
6
صفحه 13:
* پاكسازي داده
* بايگاني کردن داده قبل و بعد از پاكسازي
* تطبیق داده و يكپارچگي چند منبع داده اي
* تحلیل سطح بالا
* محاسبه ديدهاي تحليلي از ديدهاي بايه©» ايجاد بارامترهاي تحليلي
خصوصي سازي
* استخراج و خصوصي سازي اطلاعاتک ایجاد پایگاه پردازش تحليلي خاص
6
صفحه 14:
صفحه 15:
نظارت بر داده های منابع مختلف QePreskwed
استخراج تغییرات
تغییر شکل داده هاي استخراج شده به شکل تعریف شده در
پایگاه پردازش تحليلي
یکپارچه کردن اطلاعات
پاك سازي داده هاي عملياتي
نتيجه گيري داده هاي جدید
ایجاد تاریخچه براي داده ها
بارگذاري در پایگاه پردازش تحليلي
صفحه 16:
تقسیم بنديهاي پایگاه پردازش تحليلي براساس سرعت نوسازي داده
* كلاس اول
* جند ثانيه يس ار بهنكام سازي منبع داده بروز مي شوند.
* اجراي تراكنشهاي كمي در زمان انتقال داده از محيط عملياتي به يايكاه بردازش تحليلي
كلاس دوم
ذخیره داده هاي یکپارچه و جمع شده در منبع داده مياني
* انتقالبه پایگاه پردازش تحليلي به طور متناوب(هر چند ساعت یکبار)
كلاس سوم
* آسنکرون
پم * بروز رساني طولانیتر (روزانه یا ماهانه)
صفحه 17:
حجم زباد داده های ذخیره شده
۴ انتشار تغییرات در هنگام نوسازي داده
* نوسازي داده مستلزم اجراي میزان كاري با پيچيدگي هاي متفاوت است.
* باعث کارايي مختلفي بسته به سطح معماري مي شود.
* ممکن است به طور همزمان با پردازش پرسشها انجام شود.
۳ افزایش در دسترس بودن* کاهش زمان نوسازي داده
پايگاه پردازش تحليلي
1
عناوين اصلي
تعريف پايگاه پردازش تحليلي
تفاوت با پايگاه عملياتي
انواع داده در پايگاه پردازش تحليلي
ساختار پايگاه پردازش تحليلي
مشخصات پايگاه پردازش تحليلي
جدول حقيقت
جدول ابعاد
فرايند طراحي مدل چندبعدي سيستم
معماري پايگاه پردازش تحليلي
2نوسازي داده در پايگاه پردازش تحليلي
روش ساخت پايگاه پردازش تحليلي
تعريف پايگاه پردازش تحليلي
• 1992پايگاه پردازش تحليلي ،پايگاه داده اي به منظور تصميم گيري مي باشد
كه داراي خصوصيات غيرقابل تغيير ،در يك محدوده وس$$يع زم$$اني ،يكپارچ$$ه و
مبتني بر موضوع مي باشد.
• 1995مجموعه اي از پايگاه داده ه$$اي يكپارچ$$ه ،مبت$$ني ب$$ر موض$$وع و بهين$$ه
طراحي شده براي پشتيباني از سيستم هاي تصميم يار
• 1996منبعي كه كاربران نهايي مي توانند در آن به داده هايشان دسترسي پيدا
كنند.
• 1997مجموعه اي از اطالعات يكي شده حاص$$ل از سيس$$تم ه$$اي عملي$$اتي و
برخي منابع داده خارجي با هدف پشتيباني از تصميم گيريهاي تجاري.
3
تعريف پايگاه پردازش تحليلي
(ادامه)
• جامعترين تعريف
– منبع داده جمع آوري شده از داده هاي منابع اطالعاتي مختلف و حتي ناهمگن
– تحت يك ساختار
– در يك محدوده وسيع زماني
– با هدف پاسخگويي به پرسشهاي تحليلي كاربران
4
تفاوت با پايگاه عملياتي
پوشش دامنه زماني وسيع تر
يك پايگاه داده يكپارچه حاصل از پردازش چندين پايگاه داده
عملياتي
قابليت پاسخگويي به پرسشهاي پيچيدة كاربران و برنامه هاي
كاربردي
5
مشخصات پايگاه پردازش تحليلي
مبتني بر موضوع
سازماندهي داده ها بسته به چگونگي ارجاع كاربران
يكپارچگي
يكپارچه سازي اسامي
يكپارچه سازي واحدهاي اندازه گيري متغيرها
يكپارچه سازي ساختارهاي رمز نگاري
فيلد جنسيت با ( Mو ) Fيا ( 0و )1يا ( Xو )Yيا ( femaleو )male
حذف ناسازگاريها و اطالعات متاقض
داده هاي يكپارچه
غير قابل تغيير
داده هاي فقط خواندني
6
مشخصات پايگاه پردازش تحليلي
محدوده وسيع زماني
(ادامه)
محيط هاي عملياتي گستره زماني 90-60روز
پايگاه پردازش تحليلي گستره زماني 10-5سال
خالصه شده
داده هاي تحليلي مناسب براي تصميم گيريها
حجيم
به علت محدوده وسيع زماني
نرمال نشده
امكان وجود افزونگي
7
انواع داده در پايگاه پردازش تحليلي
داده جاري
داده هاي فعلي منابع عملياتي
داده قديمي
داده هاي قديمي منابع اطالعاتي
داده خالصه شده
فرمت فشردة اطالعات موجود شامل اطالعات نتايج
فراداده
8
اطالعات مربوط به داده ها
ديكشنري از اطالعات پايگاه
راهنمايي جهت نگاشت داده از محيط عملياتي به محيط پايگاه پردازش تحليلي
قوانين استفاده شده براي خالصه سازي
ساختار پايگاه پردازش تحليلي
جدول حقيقت
شمارشي ،پيوسته
پاسخ هر پرسش شامل تعداد زيادي ركورد است كه در تعداد سطرهاي كمي براي
كاربران ارائه مي شوند.
كليد اصلي هر جدول تركيب كليدهاي خارجي جداول ابعاد مي باشد.
Item-id
Store-id
Customer-id
Date
Number
price
9
)(ادامه
ساختار پايگاه پردازش تحليلي
جدول ابعاد
توصيف متني بعدهاي تجارت
ويژگيها متني و گسسته هر بعد داراي چند ويژگي پايگاه داده خوب
Date
Store-id
Item-id
Customer-id
Month
quarter
year
City
state
country
Itemname
color
size
category
Name
street
city
state
zipcode
country
10
)(ادامه
ساختار پايگاه پردازش تحليلي
شماي ستاره اي
Store-id
Item-id
City
state
country
Itemname
color
size
category
Date
Month
quarter
year
Item-id
Store-id
Customer-id
Date
Number
price
Customer-id
Name
street
city
state
zipcode
country
11
فرايند طراحي مدل چندبعدي سيستم
انتخاب فرايند تجاري
فرايند عملياتي اصلي سازمان
سيستم فروش ،سيستم خريد و ...
انتخاب دانه
ركوردي از جدول حقيقت
انتخاب بعد
مثل زمان ،محصول ،مشتري و ...
انتخاب حقايق قابل اندازه گيري جدول حقايق
مقادير شمارشي و افزودني
12
روش ساخت پايگاه پردازش تحليلي
آماده سازي
استخراج داده
پاكسازي داده
بايگاني كردن داده قبل و بعد از پاكسازي
يكپارچگي
تطبيق داده و يكپارچگي چند منبع داده اي
تحليل سطح باال
محاسبه ديدهاي تحليلي از ديدهاي پايه ايجاد پارامترهاي تحليلي
خصوصي سازي
استخراج و خصوصي سازي اطالعات ايجاد پايگاه پردازش تحليلي خاص
13
معماري پايگاه پردازش تحليلي
Data warehouse
Data source 1
Data source 2
.
.
.
Data source n
Data
Loader
DBMS
Query and
analysis tools
14
نوسازي داده در پايگاه پردازش تحليلي
نظارت بر داده هاي منابع مختلف
Refreshment
استخراج تغييرات
تغيير شكل داده هاي استخراج شده به شكل تعريف شده در
پايگاه پردازش تحليلي
يكپارچه كردن اطالعات
پاك سازي داده هاي عملياتي
نتيجه گيري داده هاي جديد
ايجاد تاريخچه براي داده ها
15بارگذاري در پايگاه پردازش تحليلي
نوسازي داده...
(ادامه)
تقسيم بنديهاي پايگاه پردازش تحليلي براساس سرعت نوسازي داده
كالس اول
چند ثانيه پس ار بهنگام سازي منبع داده بروز مي شوند.
اجراي تراكنشهاي كمي در زمان انتقال داده از محيط عملياتي به پايگاه پردازش تحليلي
كالس دوم
ذخيره داده هاي يكپارچه و جمع شده در منبع داده مياني
انتقال به پايگاه پردازش تحليلي به طور متناوب(هر چند ساعت يكبار)
كالس سوم
آسنكرون
بروز رساني طوالنيتر (روزانه يا ماهانه)
16
مشكالت نوسازي داده
حجم زياد داده هاي ذخيره شده
انتشار تغييرات در هنگام نوسازي داده
نوسازي داده مستلزم اجراي ميزان كاري با پيچيدگي هاي متفاوت است.
باعث كارايي مختلفي بسته به سطح معماري مي شود.
ممكن است به طور همزمان با پردازش پرسشها انجام شود.
افزايش در دسترس بودن كاهش زمان نوسازي داده
17