صفحه 1:
۷
Gupervisor ای
Cera ran cath PA Cl NN Ne rat aN aI
4
صفحه 2:
آنالیز فاکتور چیست ؟ .بب
* آنالیز فاکتور نام عمومی است که به دسته ای از روش های آماریٌ
چند متفیره اطلاق می شود که هدف اولیه آنهاء تعریف ساختار نهفته
در ماتریس داده ها است.
* آنالیز فاکتور رابه عنوان اولین تکنیک چند متغیره معرفی کرده اند.
چرا که می تولند نقش بی نظیری در + بکارگیری سایر تکنیک های
صفحه 3:
آنالیز فاکتور چیست ؟ 02777
**با اين تكنيك مى توان تعداد زيادى متغير را در یک یا چند CPSU
بعد توضيح داد.
**متغيرهاى وابسته به هم در يك كروه قرار مى كيرند. اين متغيرها با
ديكر متغيرها يا وابستكى ندارند يا وابستكى كمى دارند.
**مشکل تعداد زياد متغيرها و وابستكى درونى داده ها را مى توان با
صفحه 4:
#*هدف در این تکنیک تنها کاهش حجم داده هاست .
** در این تکنیک با تعریف چند Be, Component )2
اساس BComponent 5. & > 5 Oorrehiod »>«
بندی می کند بگونه ای که بیشترین درصد واریانس داده ها را در
:011121 6ه قرار بكيرند .
صفحه 5:
بين )و 6۳00
* مقیاس اندازه گیری در هر دو باید لسطت؟ یا ع8() با مکم
باشد )
* اندازه نمونه بزرگ برای برآورد پایدار بین ۱۰ تا ۲۰ مشاهده برای هر متفیر
باید باشد .
* هدف هر دو روش بالا کاهش حجم داده هاست .
* به علت شباهت در تکنیک های آماری گاهی اين دو روش را با هم اشتباه
می گیرند .
** و ۳0۸ دو تکنیکآمایوب سیار کاربردیو قویهستند .
* نمونه گیری باید تصادفی باشد .
برای هر متغیر حداقل باید ۵ مشاهده وجود داشته باشد و در کل حداقل
۰ مشاهده وجود داشته باشد .
صفحه 6:
بین 6۵08 و 6۳00
نتایج حاصل از اين دو تکنیک زمانیکه وابستگی زیاد باشد بسیار
شبیه هم می باشد .
**ارتباط خطی بین متغیرها ی مشاهده شده وجود دارد .
** متفیرها باید دارای توزیع نرمال باشند .
**متغيرها دو به دو دارای توزیع نرمال دو متفیره هستند .
صفحه 7:
هاى- بين 0208 و 00 -
| ۱۴ در ۳۸ علاوه بر هدف کاهش داده ها ما به دنبال پیدا کردن
ساختار داده ها می باشیم .
صفحه 8:
دهای تصمیم آنالیز فاکتور --
اهداف آنالیز فاکتور
طراحی یک آنالیز فاکتور
** فرضیات در آنالیز فاکتور
مشتق ساختن فاکتورها و ارزیابی برازش کلی
eet فاکتورها
اعتبار سنجی آنالیز فاکتور
کاربردهای دیگر نتایج آنالیز فاکتور
صفحه 9:
اهدف آالیز فاکتور . .----
به طور کلی دو هدف عمده در آنالیز فاکتور مدنظر است.
۳
** تعيين ساختار از طریق خلاصه سازی داده ها
* کاهش حجم داده ها
صفحه 10:
راحی یک | ليد فاكد حص —
** محاسبه داده های ورودی به منظور ارضای اهداف اختصاصی
گروه کردن متغیرها یا پاسخ دهنده ها —
**طرح تحقیق در مورد تعداد متفیرها . خصوصیات اندازه گیری آن
ها و نوع متغیرهای مجاز
مقتضیات اندازه نمونه. هم در نوع مطلق و هم به عنوان تابعی از
تعداد متفیرهای موجود در آنالیز
صفحه 11:
ارتباط بین متفیرها خطی است.
**متغيرها داراى توزيع نرمال می باشند.
* متغيرها دو به دو داراى تابع توزیع نرمال دو متغیره هستند.
صفحه 12:
ساختن فاکتورها و ارزیا بی بر ازش --
**روش استخراج فاکتورها
** تعداد فاکتورهای انتخاب شده برای نمایش ساختار نهفته
صفحه 13:
برای تعداد فاکتورهاح-
igh pe?
معیار اولیه *
معیار درصد واریانس **
۰ 1
** معيار ازمون 5797
صفحه 14:
يد د
چرخش فاکتورها a
.هدف از جرخش فاکتورها دو بخش است
** دستکاری آماری نتایج برای اینکه فاکتور بیشتر قابل
**اتخاذ تصمیم نهائی در مورد تعداد فاکتورهای زیربنائی
داده ها.
*روش های چرخش متعامد به صورت کلی شامل سه
صفحه 15:
SE چرخش
95
* Quarkwux
ساده سازی سطرهای . 60۷ G23 > 5! ***هدف نهايى
7 Quran Sy ge gn & AL ماتریس فاکتور می
روی چرخش فاکتور ابتدائی تمرکز می کند تا اينکه بارگذاری
یک متغیر بر روی فاکتور بالا شود و تا حد امکان بر روی
فاکتورهای دیگر کم شود.
٩ سممبون
#* بر خلاف ۵ . معیار ۵۷۵۲() بر روی ساده سازی
ستون های ماتریس فاکتور تمرکز دارد. به این صورت که .
روش ۰0/۲ جمع واریانس های بارگذاری های مورد نیاز
صفحه 16:
SEH
9
“6
** این رویکرد عملاً به گونه ای بينابين دو روش قبل عمل مى
eS
۲ ۱
ol روش به جای تمرکز بر روی ساده سازی سطرها و یا
ساده سازی ستون ها تلاش دارد که بخشی از هر کدام را
صفحه 17:
صفحه 18:
صفحه 19:
صفحه 20:
ga? قانون کلی به منظور رامنمایی محقق در زمینه انتخاب یگ
تکنیک چرخش قائم یا اریب وجود ندارد. در بسیاری موارد. محقق
به سادگی از تکنیک های چرخشی ارائه شده توسط برنامه
کامپیوتری بهره می گیرد. بسیاری از برنامه های چرخش پیش فرض
a : 5
Orta )| در نظر میگیرند. اما روش های چرخش مهم به
صورت گسترده در دسترس می باشد. اما هیچ دلیل تحلیلی مکمل
برای ترجیح یک روش چرخش بر دیگری وجود ندارد. انتخاب یک
روش چرخش اریب يا قائم باید براساس نیازهای ویژه مسئله
صفحه 21:
te “S ۰ ا ليه wees
مستقیم ترین روش اعتبار سنجی نتایج. حرکت (BASE jhe Cee 02S
و ارزیابی دفاع از نتایج. هم با یک نمونه گسترده در مجموعه داده های
اولیه یا با یک نمونه مجزا می باشد. مقایسه دو یا چند مدل فاکتور
همواره كيج كننده مى باشد. به هر حال. چند گزینه برای یک مقایسه
موضوعی وجود دارد. لزوم آنالیز فاکتور تائیدی ( 00208 ) از طريق
ملّلسازی معادلات ساختاری یک گزینه را مهیا ساخته است. اما به طور
کلی پیچیده تر است و نیاز به بسته های نرم افزاری نظیر DIGREL یا
COG دارد.
صفحه 22:
۱ _ آنالیز فاکتور اکتشافی
(Exporapry Pucior Budpsis)
۲ آنلیز فاکتور تاییدی
صفحه 23:
در این رویکرد به دنبال پیدا کردن ساختار نهان داده ها و کاهش
حجم داده ها هستیم .
em |
** در اين رويكرد هيج پیش زمینه ای در مورد ساختار بین متغیر ها
صفحه 24:
rh BH آنالیز فاکتور
**یک تکنیک آماری است که برای بازبینی و تست یک ساختار مورد
نظر در مورد داده ها از یک مجموعه متغیرهای مشاهده شده است .
[* 260 که محققایرلمکانرا می دهد که فرضیانخود را در مورد
رلبطه بیرمتغیرهای مشاهده شده و ساختار نهانداده ها تست
صفحه 25:
آنالیز فاکتور تاییدی و اکتشاف ی"
)و (26۳6) دو روشلماریسنکه بسرلی لنداید گیری
لعتبار مقیاسربه کار می رود .
هر دو مدل بر اساس مدل آماری خطی بنا شده است
*#*هر دو تکنیک فرضیه نرمال بودند را برای متغیرها دارند .
oe
* در هر دو تکنیک متغیرها دسته بندی می شوند .
صفحه 26:
قای آنالیر فا کتور تاییدی و اکتشافی
دك :
بايد يك مدل اوليه داشته باشيم
تعداد فاكتورها مشخص باشد
مشخص باشد كه هر متغير در كدام فاكتور قرار مى كيرد .
ؤم :
ساختار داده ها را به وسيله اين تكنيك تعيين مى كنيم .
ييشترين درصد واريانس داده ها را در فاكتورها قرارمى دهد .
صفحه 27:
9۵ 02 ١ 012010 : 0۱2 ۱۳۱۹۵۸۹۵۹۵۵ ۲
0۳/۳0
53۳۳۳ 2555-0
Personnel wage
Equipment’s set up time
Product's quali
صفحه 28:
rem oF PD bePore vont
a EE
Services
03971 0.1385 0.4995 0.2002 :
نام
0.1708 0.1627 0.1809 ۳ [7
0.1264 0.0057 0.1328 0.7022 eat
0.1252 0.422 0.2176 0.7978 Software cost
ore 0.7335 0.2759 0.2133 حم
8 6 Product's
0.4257 0.1515 02317 0.0984 reste
0.1002 0.4890 02361 0.1508 Sera
0.0713 -0.1068 0.3075 زووقة ميصلوسمملاو
set up timing
statu
0.0271 0.6731 0.2179 0.3074 human
0.2151 0.1721 0.5663 0.1603 سر
ie ose nee Be satisfaction
0.2086 02178 -0.3360 93055 aulpment
-0.1927 مره o.asaa 0.2888 ses
0.0682 -0.1927 0354 0.5943 Hardware cost
0.2416 0.2467 0.7213 0.2476 Produit
quality
صفحه 29:
ها ی ۳۵ ۴ ی
3 جع ع هه ت۳۳
Services quality 0.0924 0.6855 0.0161 0.0836-
Paulpment’s ware 0.6254 0.0770 0.4240 0.1703
personnel training )"01654 0.0786 0.1930 0.2008
Software cost 0.8315( 0.1764 0.0517 0.0558
Hardware facilities 0.0252 0.0340 0.8502 0.0102
-—-—Produet’s defect 0.0330 0.0143 0.0942 0.4806
Software facilities 0.0686 0.2809 0.4149 0.2289
etna eat و 0.0519 0.0460
oaess | o7e12 0.0551 o.ao1 Seif human
-oa1a1 Customer, مه 0.0072 0.1203
Equipment safety 0.1466 0.0622- 0.0680 0.6566-
Personnel damages 0.0734( 0.1458 0.3732 0.4362
Hardware cost .0.6132 0.0996 0.0270 0.0880
Product's quality 0.1844- 0.8166 0.0522 0.1651
asl aA
1 0.3764 0.1874 0.2669 0.429
لوم eae 0.2363- 0.3737 0.0262 0.1259-
Personnel efficiency
< 0.1708 0.2048 02444 0.6466 Personal wage
0.6019 0.3368 0.2335 0.2444 Risk
صفحه 30:
دسا ۲ له موجه اه هه ۳
Eigenvalues
صفحه 31:
2D kerePore, we و۳ موی هم ) os cost. Oe Purtker bobet other
© Pavers, whick ts resus vukoinies fo cacptay Pastor © us لس
وه( بل 9 us exevuiiva vapubiliy add Picdly Pastor P os scPeiy.
Factor Analysis
Supervisor : Professor Jamal Shahrabi
Presented by : Shaghayegh Parhizi
آناليز فاکتور چيست ؟
• آناليز فاکتور نام عمومي است که به دسته اي از روش هاي آماري
چند متغيره اطالق مي شود که هدف اوليه آنها ،تعريف ساختار نهفته
در ماتريس داده ها است.
• آناليز فاکتور را به عنوان اولين تکنيک چند متغيره معرفي كرده اند،
چرا که مي تواند نقش بي نظيري در بکارگيري ساير تکنيک هاي
چند متغيره ايفا کند.
•
آناليز فاکتور چيست ؟
با این تکنیک می توان تعداد زیادی متغیر را در یک یا چند فاکتور یا
بعد توضیح داد.
متغیرهای وابسته به هم در یک گروه قرار می گیرند .این متغیرها با
دیگر متغیرها یا وابستگی ندارند یا وابستگی کمی دارند.
مشکل تعداد زیاد متغیرها و وابستگی درونی داده ها را می توان با
FAحل کرد.
Principal Component Analysis
هدف در اين تکنيک تنها کاهش حجم داده هاست .
در اين تکنيک با تعريف چند ، Componentمتغيرها را بر
اساس Correlationبين متغيرها در Componentها دسته
بندي مي کند بگونه اي که بيشترين درصد واريانس داده ها را در
Componentها قرار بگيرند .
اساس اين تکنيک وجود همبستگي باال بين متغيرهاست .
شباهت بین FAو PCA
مقياس اندازه گيري در هر دو بايد Intervalيا Ratioباشد (.کمي
باشد )
اندازه نمونه بزرگ براي برآورد پايدار بين 10تا 20مشاهده براي هر متغير
بايد باشد .
هدف هر دو روش باال كاهش حجم داده هاست .
به علت شباهت در تكنيك هاي آماري گاهي اين دو روش را با هم اشتباه
مي گيرند .
FA و PCAدو ت كنيكآماريب سيار كاربرد يو ق ويهستند .
نمونه گيري بايد تصادفي باشد .
براي هر متغير حداقل بايد 5مشاهده وجود داشته باشد و در کل حداقل
100مشاهده وجود داشته باشد .
شباهت بین FAو PCA
نتايج حاصل از اين دو تکنيک زمانيکه وابستگي زياد باشد بسيار
شبيه هم مي باشد .
ارتباط خطي بين متغيرها ي مشاهده شده وجود دارد .
متغيرها بايد داراي توزيع نرمال باشند .
متغيرها دو به دو داراي توزيع نرمال دو متغيره هستند .
تفاوت های بین FAو PCA
• در EFAعالوه بر هدف كاهش داده ها ما به دنبال پيدا كردن
ساختار داده ها مي باشيم .
• در PCAفقط به دنبال کاهش حجم داده است و به دنبال پيدا کردن
ساختار نيستيم .
فرایندهای تصمیم آنالیز فاکتور
اهداف آنالیز فاکتور
طراحی یک آنالیز فاکتور
فرضیات در آنالیز فاکتور
مشتق ساختن فاکتورها و ارزیابی برازش کلی
چرخش فاکتورها
اعتبار سنجی آنالیز فاکتور
کاربردهای دیگر نتایج آنالیز فاکتور
اهدف آنالیز فاکتور
به طور کلی دو هدف عمده در آنالیز فاکتور مدنظر است.
تعیین ساختار از طریق خالصه سازی داده ها
کاهش حجم داده ها
طراحی یک آنالیز فاکتور
محاسبه داده های ورودی به منظور ارضای اهداف اختصاصی
گروه کردن متغیرها یا پاسخ دهنده ها
طرح تحقیق در مورد تعداد متغیرها ،خصوصیات اندازه گیری آن
ها و نوع متغیرهای مجاز
مقتضیات اندازه نمونه ،هم در نوع مطلق و هم به عنوان تابعی از
تعداد متغیرهای موجود در آنالیز
فرضیات آنالیز فاکتور
مقیاس ها باید کمی باشد.
نمونه گیری تصادفی باشد.
ارتباط بین متغیرها خطی است.
متغیرها دارای توزیع نرمال می باشند.
متغیرها دو به دو دارای تابع توزیع نرمال دو متغیره هستند.
مشتق ساختن فاکتورها و ارزیابی برازش
کلی
روش استخراج فاکتورها
تعداد فاکتورهای انتخاب شده برای نمایش ساختار نهفته
در داده ها
معیار برای تعداد فاکتورها
مسیر نهفته
معیار اولیه
معیار درصد واریانس
معیار آزمون scree
Heterogeneity پ اسخ د هندگان
چرخش فاکتورها
.هدف از چرخش فاکتورها دو بخش است
دستکاری آماری نتایج برای اینکه فاکتور بیشتر قابل
تفسیر باشند.
اتخاذ تصمیم نهائی در مورد تعداد فاکتورهای زیربنائی
داده ها.
روش های چرخش متعامد به صورت کلی شامل سه
روش است:
Varimax
Quartimax
Equimax
چرخش فاکتور
Quartimax
هدف نهایی از چرخش ، Quartimaxساده سازی سطرهای
ماتریس فاکتور می باشد .به این صورت که Quartimaxبر
روی چرخش فاکتور ابتدائی تمرکز می کند تا اینکه بارگذاری
یک متغیر بر روی فاکتور باال شود و تا حد امکان بر روی
فاکتورهای دیگر کم شود.
Varimax
بر خالف ، Quartimaxمعیار Varimaxبر روی ساده سازی
ستون های ماتریس فاکتور تمرکز دارد .به این صورت که ،
روش ، Varimaxجمع واریانس های بارگذاری های مورد نیاز
ماتریس فاکتور را بیشینه می کند.
چرخش فاکتور
Equimax
این رویکرد عم ً
ال به گونه ای بینابین دو روش قبل عمل می
کند.
این روش به جای تمرکز بر روی ساده سازی سطرها و یا
ساده سازی ستون ها تالش دارد که بخشی از هر کدام را
انجام دهد.
EFA-Rotation
1
var1
var6
var4
var5
0.5
var3 var2
0
-1
-0.5
0
-0.5
-1
0.5
1
EFA- Rotation
1
var1
var6
var4
var5
0.5
var3 var2
0
-1
-0.5
0
-0.5
-1
0.5
1
EFA- After Rotation
1
var4
var6
var5
0.5
0
-1.0
-0.5
0.0
0.5
var1
-0.5
-1
1.0
var3
var2
انتخاب روش چرخش
هیچ قانون کلی به منظور راهنمایی محقق در زمینه انتخاب یک
تکنیک چرخش قائم یا اریب وجود ندارد .در بسیاری موارد ،محقق
به سادگی از تکنیک های چرخشی ارائه شده توسط برنامه
کامپیوتری بهره می گیرد .بسیاری از برنامه های چرخش پیش فرض
Varimaxرا در نظر میگیرند ،اما روش های چرخش مهم به
صورت گسترده در دسترس می باشد .اما هیچ دلیل تحلیلی مکمل
برای ترجیح یک روش چرخش بر دیگری وجود ندارد .انتخاب یک
روش چرخش اریب یا قائم باید براساس نیازهای ویژه مسئله
تحقیقی صورت گیرد.
اعتبار سنجی آنالیز فاکتور
مستقيم ترين روش اعتبار سنجي نتايج ،حركت كردن به سمت منظر تائيدي
و ارزيابي دفاع از نتايج ،هم با يك نمونه گسترده در مجموعه داده هاي
اوليه يا با يك نمونه مجزا مي باشد .مقايسه دو يا چند مدل فاكتور
همواره گيج كننده مي باشد .به هر حال ،چند گزينه براي يك مقايسه
موضوعي وجود دارد .لزوم آناليز فاكتور تائيدي ( ) CFAاز طريق
مدلسازي معادالت ساختاري يك گزينه را مهيا ساخته است ،اما به طور
كلي پيچيده تر است و نياز به بسته هاي نرم افزاري نظير LISRELيا
EOSدارد.
روش های قابل استفاده در آنالیز فاکتور
.1
آناليز فاکتور اكتشافي
()Exploratory Factor Analysis
.2آناليز فاکتور تاييدي
()Confirmatory Factor Analysis
آنالیز فاکتور اکتشافی
در اين رويکرد به دنبال پيدا کردن ساختار نهان داده ها و کاهش
حجم داده ها هستيم .
در اين رويکرد هيچ پيش زمينه اي در مورد ساختار بين متغير ها
( فاکتورها ) نداريم و به دنبال کشف و تست ساختار هستيم .
آنالیز فاکتور تاییدی
يک تکنيک آماري است که براي بازبيني و تست يک ساختار مورد
نظر در مورد داده ها از يک مجموعه متغيرهاي مشاهده شده است .
CFA به م حققاينام کانرا م ي د هد ک ه ف رض ياتخود را در مورد
رابطه ب ينم تغيرهاي م شاهده ش ده و س اختار ن هانداد ه ها ت ست
ک ند .
شباهت های آنالیز فاکتور تاییدی و اکتشافی
CFA و EFAدو روشآماريستک ه ب را ي اندازه گ يري
اعتبار م قياسب ه ک ار م ي رود .
هر دو مدل بر اساس مدل آماري خطي بنا شده است
هر دو تکنيک فرضيه نرمال بودند را براي متغيرها دارند .
در هر دو تکنيک متغيرها دسته بندي مي شوند .
تفاوت های آنالیز فاکتور تاییدی و اکتشافی
: CFA
بايد يک مدل اوليه داشته باشيم
تعداد فاکتورها مشخص باشد
مشخص باشد که هر متغير در کدام فاکتور قرار مي گيرد .
: EFA
ساختار داده ها را به وسيله اين تکنيک تعيين مي کنيم .
بيشترين درصد واريانس داده ها را در فاکتورها قرارمي دهد .
CASE STUDY: MAINTENANCE STERATEGY
SELECTION
resualts of FA before rotation
Factor 4
Factor 3
Factor 2
Factor 1
0.3971
-0.1385
0.4995
-0.2062
0.1704
0.1627
0.1809
0.7207
0.1264
-0.0657
0.1328
0.7022
0.1252
-0.1422
-0.2176
0.7978
0.1118
0.7335
0.2759
0.2133
0.4257
0.1515
-0.2317
-0.0984
0.1002
0.4890
-0.2361
0.1508
0.0713
-0.1068
-0.3075
0.8081
0.0271
0.6731
0.2179
0.3074
0.2151
-0.1721
0.5663
-0.1603
0.4086
0.2178
-0.3560
-0.3055
-0.1927
0.2143
0.4544
0.2888
0.0682
-0.1927
-0.1354
0.5943
0.2416
-0.2467
0.7213
-0.2476
)Unrotate(
criteria
Services
quality
Equipment’s
ware and tear
personnel
training
Software cost
Hardware
facilities
Product's
defect
Software
facilities
Equipment’s
set up timing
Skillful
human
resources
Customer
satisfaction
Equipment
safety
Personnel
damages
Hardware cost
Product's
quality
results of FA after rotation
Factor 4
Factor 3
Factor 2
Factor 1
criteria )rotate(
-0.0836
0.0161
0.6855
-0.0924
Services quality
0.1703
0.4240
0.0770
0.6254
Equipment’s ware
and tear
0.2098
0.1930
0.0786
0.6594
personnel training
0.0558
0.0517
-0.1764
0.8315
Software cost
0.0102
0.8502
0.0340
-0.0252
Hardware facilities
-0.4806
0.0942
0.0143
0.0330
Product's defect
-0.2289
0.4149
-0.2809
0.0686
Software facilities
0.0460
0.0519
-0.2877
0.8287
0.0899
0.7612
-0.0554
0.0616
0.1203
-0.0072
0.6267
-0.1141
-0.6566
0.0680
-0.0622
-0.1466
Equipment safety
0.4362
0.3732
0.1458
0.0734
Personnel damages
0.0889
-0.0270
-0.0996
0.6132
Hardware cost
0.1651
-0.0522
0.8166
-0.1844
0.4429
-0.2669
0.1874
0.3764
Product's quality
Environmental
effects
-0.1259
0.0262
0.3737
-0.2363
0.1704
0.2048
-0.2444
0.6466
Personal wage
0.6019
0.3368
0.2335
0.2444
Risk
Equipment’s set up
timing
Skillful human
resources
Customer
satisfaction
Equipment and
Personnel efficiency
comparison diagram of number of Factors and Eigen values
Factor name
• Therefore, we have named factor 1 as cost. We further label other
3 factors, which its results culminates in naming factor 2 as value
added, factor 3 as execution capability and finally factor 4 as safety.