صفحه 1:
صفحه 2:
Be UES ere OER Rp kode er]
ب Fe
:نگارنده
احمد مرادى
استاد راهنما:
دکتر محمود کشاورزی
اساتید مشاور:
دكب vanes رضا عيدريان
دکتر سید مجتبی صباغ جعفری
بهمن ۱۳۹۹
صفحه 3:
شناسایی جنسیت افراد از روی چهره آنها جزو حوزههای پر کاربرد. مهم و
قدیمی در پردازش تصویر
بهرهمندی از ضریب بالایی از دقت و اطمینان
بکار گیری از سیستمهای تشخیص جنسیت به دلیل کمهزینه گی و مقرون به
صرفه بودن
استفاده گسترده در فضاهلیی محتاج به جداسازی جنسیتی
عدم وجود اشتباه ناشی از خستگی در امر نظارت
صفحه 4:
تعیین هویت در مکانهای عمومی که نیاز به تفکیک جنسیتی است مانند: استخر.
ابگاههای دانشجویی و غیر:
چهرهنگلری پلیسی, مسایل نظامی, حقوقی و تعیین هویت سابقهداران
صفحه 5:
هدف اصلی طراحی سیستم هوشمند برای شناسایی جنسیت افراد از روی تصویر
چهره آنها
استفاده از شبکههای عصبی عمیق موجود برای شناسایی جنسیت
پیشنهاد یک شبکه عصبی عمیق که دارای کارایی بهتری نسبت به شبکههای
موجود باشد
صفحه 6:
استفاه از هستجوی Ata
و تابيدن تصوير ورود
ل
رك
||
بيشتهادق
1 a
Donahue 0
2 ۳۹۹
Girshick ۳ at
S. Ren
me ور Pascal vac-
Ghia Voc Net
موز
Fast R-
NN
Faster R-
‘CNN
صفحه 7:
استفاده از نقشدهاى ويزكى کمک VGC.
و يتجردهاى بيش فر ea Net
استفاده از بنج شبكه كاتولوشن ۲ Wider
بای استخراحویژگی Face
Wider
et ResNet
خروجی هر لاه از شبكه ييه به Wider
Faster R-CNN اير
re
S. Yang
مسا ظ
©.€. Loy
PHu
2
Ramanan
S. Yang
¥. Xiong,
©... Loy
X. Tang
صفحه 8:
I
I
I
| مه =
| Krizhevsky me ao ; آموزش بر روي دو کارت +
اب actiierer Net يشرو ايش بوي
I 1 Hinton
3
es en en ee eee
۱ t ¥. Jia ‘Net استفاده از ماژول تلقین. +
۱ ۱
بیع سس i A ae
8 ا ie i ea aoe د
صفحه 9:
مدلهای آماری
الهام گرفته شده از شبکههای عصبی بیولوژیکی
قادر به مدلسازی و پردازش روابط غیرخطی بین ورودی و خروجی به طور موازی
|
۱
I
|
, |
پرسپترون |
سادهترین نوع شبکه عصبی ne
ابداع توسط روزنبلات 4 3 I
I
۱
I
I
۱
I
شامل ۳ لایه نورون ~
- لیه ورودی ©
ا ©
- لایه خروجی @~
صفحه 10:
۲۵ ره Tee i
Routt
سوه
328 ماه
0
صفحه 11:
پرسپترون چ
زیرمجموعهای از شبکههای عصبی مصنوعی
شامل یک یا چند لایه پنهان بین لایه ورودی و خروجی
پر کاربرد ترین مدل در شبکه عصبی
استفاده از الگوریتم پس انتشار خطا به عنوان بخشی از مرحله یادگیری
ليه ينوان 7 ١ لاي ينهان
الكوريتم يس انتشار خطا
حركت رو به جلو
انتشار رو به عقب خطا
صفحه 12:
ورودى اعمال شده به شيكه.
پردار ورودی شبکه
بردار برجسب مطلوب |
بردار خروجى متناظر
صفحه 13:
گرادیان کاهشی تصادفی
گرادیان کاهشی دسته کوچک
گشتاور
AdaGrad
AdaDelta
RMSprop
Adam
صفحه 14:
صفحه 15:
Bic ne eee
پیشنهاد شده توسط یلن لکون و همکاران
استفلده از شبکههای عصبی کانولوشن برای تجزیه و تحلیل تصاویر
تعداد زیاد لایهها
اتصال هر نورون فقط به قسمتی از ورودی (ناحیه دریافتی)
استفلده از وزنهای پنجرهای (فیلترها)
استفاده از چند فیلتر در هر لایه ( چند خروجی در هر لایه )
مناسب برای دادههای تصویری
توانایی دستهبندی و استخراج خصوصیات و ویژگیهای تصویر
متشکل از سه لایه اصلی
صفحه 16:
یاد گیری انتقالی
استفاده از دانش کسبشده توسط یک سیستم یاد گیری, در انجام یک فعالیت
متفلوت ولی مر تبط
+ از پیش آموزش دیده
۰ بازتنظیم
صفحه 17:
از ۳ شبکه کانولوشن ۱۱6 O-Net 5 P-Net.
قادر به تشخیص چهره پنج موقعیت برجسته صورت
استفاده از مجموعه داده ۴۵6۴ ۷۱0۴٩ برای آموزش شبکه
- حاوی ۳۲۲۰۳ تصویر و ۳۹۳۷۰۳ چهره با برچسب
صفحه 18:
ارائه توسط سیمونیان و همکاران
پرندهی رقابت 2013 ILSVRC
ارائه در پیکر بندیهلی مختلف
آموزش با ۱۶ میلیون تصویر
تصویر ورودی ۲۲۴۰۲۲۴۶۳
صفحه 19:
از روى تصوير جهره
فلوچا
ارت روش پیشنهادی
few een Deore rr
صفحه 20:
۰ تصوير جهره
دو دسته چهره مرد و چهره زن
حدود ۷۰۰۰۰ شخص متفاوت
0 زاويه متماب
٠٠ حالت چهره متنوع
نژادهای گوناگون
صفحه 21:
ia
آع ۵ ۵ ۵ ۵
Bane
انها اها اها انها اها
سب 40 1
5
Rete ee LT RES eT TOE lo aed
صفحه 22:
Rete ee LT RES eT TOE lo aed
شناسایی چهره
استفاده از شبکهی ازپیش آموزش دیده(!۷/۲0۱
ايجاد هرم تصوير
وارد كردن تصلوير مقیلس بندی شده به ۴-۱۱61
حرکت در تصویر و حدس نواحی وجود چهره
ایجاد کادرهای محصور کننده در صورت یافتن چهره
استاندارد سازی مختصات
حذف کادرهای با سطح اطمینلن پا
ذخیره مختصات کادرهای محصورکننده باقیمانده
انتقال کادرهای باقیمانده به 8-۱16۲
عملکردی همانند ۳-۱۱6۲ و حذف کادرهای با سطح اطمینان پایین
انتقال کادرهای باقیمانده به 0-۱164
عملکردی همانند ۳-۱۱6۲ » R-Net و حذف کادرهای با سطح اطمینان پایین
بر گرداندن سه خروجی شامل مختصات کادرهای محصور کننده, مختصات پنج
نقطه برجسته چهره و سطح اطمینان هر کادر
صفحه 23:
صفحه 24:
برش چهرههای شناسایی
ایی شده و حذف جزییات ۶
ف جزبيات غير مفيد
988
صفحه 25:
ساخت مدل برای دستهبندی
استفاده از مدل ۷6616
نگهداشتن لایههای استخراج کننده ویژگی
حذف لایههای مربوط به دستهبندی
اضافه کردن ۳ لایه تمام متصل برای دستهبندی مسئله مورد نظر
استفاده از تابع فعللساز لاع در دو لايه اول و 50۲73 در لایه نهایی
بهره بردن از بهینهساز ۸۵۸
دارا بودن مدل ساخته شده از حدود ۲۰ میلیون پارامتر
- ۱۵ میلیون پارامتر ثابت نگه داشتهشده
= ۵ میلیون پارامتر با قابلیت آموزش
صفحه 26:
صفحه 27:
آماده سازی دادهها
استفلده از کلاس 66۳6۲۲0۲ ۱۳۱۵96]2312 برای بار گذاری خود کار
مجموعهدادههای آموزش: تست و ارزیابی
استفاده از یک تکرار گر برای بارگذاری تدریجی دادهها
اندازه دسته تصاویر مناسب
اب تعداد دسته تصاویر برای آموزش تکرار گر
آماده شدن تکرار گر و استفلده از آن هنگام برازش و ارزیلبی مدل
صفحه 28:
لس را اس
آموزش مدل
اختصاص ۱۲۰۰۰ تصویر برای دادههای ارزیابی
اختصاص ۲۶۰۰۰ ۱تصویر برای دادههای آموزش
تقسیم مجموعهداده آموزش به شش قسمت
ثابت نگهداشتن پارامترهای لایههای استخراج کننده ویژگی
تنظیم پلرامترهای لایههای تمام متصل مدل ساختهشده
آموزش مدل در شش مرحله
استفاده از توقف زودهنگام برای تعیین تعداد دوره و توقف روند آموزش
(آزمایش اول)
استفاده از حذف تصادفی و سعی در یافتن بهترین و مناسبت
برای آموزش به صورت تجربی (آزمایش دوم)
تعداد دوره
صفحه 29:
استفاده از مدل در تصاویر چند چهره
استفلده از ۳ هزار تصویر برای دادههای تست
- ۴۸۵۹ چهرهزن
- ۴۱۶۰ چهره مرد
* برچسب گذاری تصاویر به صورت _۲03_75_ برای سهولت
MTCNN 454i @ اعمال تصاویر *
* بدست آوردن مختصات چهرهها و برش آنها
* _ استفاده از مدل ساختهشده برای پیشبینی جنسیت افراد از روی چهره
صفحه 30:
بتفاده از مدل در تصاویر چند چ
>.
صفحه 31:
صفحه 32:
آزمايش اول
wer ar
wn
wav
were
3 5
we <a
wie
دقت دادمهاى آمويش سه
. دادمهاى ايزيابي ads
2 3 4 5 6
لقتل هورة
و
wu
90
هف درس
صفحه 33:
۱
ی | دفت در دادههای: ۱
one) 1] 1 | 1
AM. ۹۳۴۸ ۹۳۳۳
۹۳۶۹ ۹۳ مت
املو ۴۳۳ ۱۵۳۶۵
راو ٩۳۲۵ ۱-۸۹۰
۱۶۴۲۵ ۳ ۸
المعو ۹۳۱۲۸ 121۳
صفحه 34:
دفت دادههای ارزبابی سه- دفت دادهای آموزش سوت
صفحه 35:
از روی تصویر چهره آنها با
دقت مدل ساخته ش
چهره نشده
صفحه 36:
E 1 1
3 أ
١
:
3
1
826 ۲۵ ۶۱ ۸0۱
۳1
0 ۱
اس مس مت ا
q Se
صفحه 37:
a
3,
4
افراد در نژادهای گوناگون
صفحه 38:
توا
انمندی مدل در تشخیص جذ
6
Ss
قن لس رص إلى 30
لم لم لحن وى لد |
ختلف جهره
از روى تصوير جهره
۱
3
صفحه 39:
aaa
افراد در زاویههای متفاوت چهره
| توانایی مدل در >
(تمامرخ سهرخ و نیمرخ)
۱۱826 ۱۴0 ۲
M100.0% 1100.096 3100.096 ۵
صفحه 40:
1M 1000%
M1000% 100.0%
صفحه 41:
1 | عدم یافتن چهره موجود در تصویر(خطاهای شبکه (۲۲(۱)
رین ممصا |
100.0% 100.0% M1000% 100.0% ۱ ۸
صفحه 42:
شناسایی بخش فاقد چهره در تصویر به عنوان چهره (خطای شبکه
(MTCNN
7
m1000% Wi00.0% Mai 2 ا
۴ 5 :2 ع
W100.0% ۰۱۱1۵00۶ 100.0%
صفحه 43:
پرداختن به شاخههای دیگری از تحلیل چهره از قبیل:
*_ تشخیص حالات چهره و احساسات
تشخیص سن افراد
* _ تشخیص جهت قرارگیری چهره
طراحی مدلی با عمومیت بیشتر. با افزودن کلاس غیر انسان و آموزش مدل با
مجموعهدادههای عظیم و تلاش برای بهبود نتایج
صفحه 44:
٠ Y. Lecun, L. Bottou, ¥. Bengio, and P. Haffner, “Gradient-
based learning applied to document recognition,” Proc.
IEEE, vol. 86, no. 11, pp. 2278-2324, Nov. 1998.
۱
I
I
| ٠ K. Zhang, Z. Zhang, Z. Li, S. Member, Y. Qiao, and S.
۱ Member, “Joint Face Detection and Alignment using Multi
- task Cascaded Convolutional Networks,” IEEE Signal
| Process. Lett., vol. 23, no. 10, pp. 1499-1503, 2016.
۱
I
۱
I
|
|
٠ K. Simonyan and A. Zisserman, “Very deep convolutional
networks for large-scale image recognition,” 3rd Int.
Conf. Learn. Represent. ICLR 2015 - Conf. Track Proc., pp.
1-14, 2015.
صفحه 45:
کی 49 0
| از وحم
صار رم
صفحه 46:
آزمایش اول (افزایش عرض لایهها)
۱ افزایش عرض لایهها از ۳۰۰ و ۱۰۰ نورون, به ۴۰۰ و ۲۰۰ نورون
[22777
| ob) | ea ۱
۱ ۷ 1-00) aver علقم
| ۶ 1۳۶۹ ara ۸۸۷۰
۱ ۰ ۶ a sors لكيه
۱ ۰ 18 ۵ aan) ۹۵۸ عليه
۱۳" ۰ ۷ ۱۰۳۳ sore uw
| ve... ۶ wer sory ase
صفحه 47:
آزمایش دوم(افزایش تعداد لایهها)
افزایش تعداد لایهها از ۲ لایه تمام متصل به ۳ لایه تمام متصل (بجز لایه خروجی) که در SOY
اول ۴۰۰؛ لایه دوم ۲۰۰ و لایه سوم ۱۰۰ نورون قرار دادیم |
۱ ۷ ry ۹۳۹ ۸2۹
۶ 1۳۳۲ 1۳۸۹ ۸۸۷۰
Press ۵ ۱-۶۸ ۹۴۳۴ 1۰۶۷
Jove... oes 3 ۱۴۳۶۵۲ ۹۵.۸ ۹۱4۵۹
۱ ۳۴۳.۰ ۵ ۹۸۳۱ ۹2۳۸ يقل
| ۶ Were tea ar
صفحه 48:
آزمایش سوم(افزودن 49 (CNN
افزودن یک لایه 2۱(۷) به آخرین لایه فریز شده به همراه ۳ لایه تمام متصل
۹۶۵ ۸۶-۹
۹۶۶۶ ۹۱۶۵
۹۶۶۲ sy
۹۶۹۸ ۹۱۵۲
۹۶-۰ ara
I
I
I
|
|
|
۹۶۶۹ املق |
|
۱
I
I
I
oray
۱۶۰۶۷
۳۳۸۰۱
Vevey
۴۰۶۵۷
صفحه 49:
۱ lo ded
صفحه 50:
ADAM
صفحه 51:
عملیات کانولو
شن
١
0