پردازش تصویر
در نمایش آنلاین پاورپوینت، ممکن است بعضی علائم، اعداد و حتی فونتها به خوبی نمایش داده نشود. این مشکل در فایل اصلی پاورپوینت وجود ندارد.
- جزئیات
- امتیاز و نظرات
- متن پاورپوینت
برچسبهای مرتبط
- OCR
- pixel
- آبجکت های درون تصوير
- انواع سيستم OCR
- بازشناسی الگو
- بازشناسی نوری حروف
- بزرگ نمايی
- پاورپوينت پردازش تصویر
- پاورپوینت
- پاورپوینت آماده
- پاورپوینت رایگان
- پردازش تصوير
- پردازش متن
- پيکسل
- تصوير
- جدا کردن آبجکت ها
- دانلود پاورپوینت
- دانلود پاورپوینت آماده
- دانلود پاورپوینت رایگان
- دوربين ديجيتال
- قطعه بندی ضمنی
- قلم نوری
- گرافيک کامپيوتری
- مرز تصوير
- همسايگی
پردازش تصویر
اسلاید 2: 2به نام خداعنوان پروژه : تحقيق و بررسي کاربرد هاي پردازش تصويرواحد درسي : درس گرافيک کامپيوترياستاد مشاور : جناب آقاي دکتر درخشاناستاد راهنما :جناب آقاي دکتر درخشانتهيه کنندگان : حسن جباري 83912515661 امين ثابت قدم اصل 83912515760
اسلاید 3: 3اهدافمقدمه اي بر پردازش تصوير و تعريف اصطلاحات معرفي چند کاربرد از پردازش تصوير پردازش متن ( ORC )
اسلاید 4: 4مقدمه اي بر پردازش تصوير مقدمهمقدمه اي بر پردازش تصوير در هر سيستمي و با هر عملکردي براي تصميم گيري به داده هاي ورودي احتياج داريم. اين ورودي ها ميتوانند از يک سنسور صوتي, سنسور فاصله سنج , سنسور مادون قرمز , ميکروفن و با تصاوير ارسالي از يه دوربين باشد.امروزه پردازش تصوير بهترين ابزار براي استخراج ويژگي ها و تحليل موقعيت و در نهايت تصميم گيري صحيح مي باشد. در مورد انسان نيز به همين صورت است, اطلاعات از طريق چشم به مغز ارسال مي شوند و مغز با پردازش اين اطلاعات تصميم نهايي را گرفته و فرمان را صادر مي کند.هدف از پردازش تصوير پياده سازي عملکرد ذهن انسان در قبال داده ها و انجام پردازش هاي خاصي براي استخراج ويژگي مورد نياز براي رسيدن به هدف از پيش تعيين شده مي باشد.
اسلاید 5: 5مقدمه اي بر پردازش تصوير اصطلاحات1 - چند تعريف پيکسل کوچکترين جزء PIXEL است . پيکسل مخفف Picture Element به معني المان تصوير است. يک تصوير متشکل از تعداد زيادي پيکسل است که در کنار هم قرار گرفته اند . در واقع زماني که با يک دوربين ديجيتال عکس مي گيريد اگر رزولوشن دوربين شما 640480x باشد به اين معني است که ماتريس با ابعاد 640480x در اختيار شماست که 640 پيکسل در طول و 480 پيکسل در عرض دارد . به ازاي هر پيکسل يک سلول نوري در دوربين وجود دارد. شدت نور اين سلول نوري مقدار عددي را براي اين پيکسل تعيين مي کند. به طور مثال به ازاي رنگ سياه مقدار صفر در پيکسل ذخيره مي شود و به ازاي رنگ سفيد مقدار 255 در آن ذخيره مي شود.
اسلاید 6: 6مقدمه اي بر پردازش تصوير اصطلاحاتهمسايگي :2 نوع همسايگي وجود دارد همسايگي 8 تايي به صورت :(i - 1 , -1) , ( i , j - 1) , ( i + 1 , j - 1 ) , ( i - 1 , j ) , ( i + 1 , j ) , ( i - 1 , j + 1) , ( i , j + 1 ) , ( i + 1 , j + 1)همسايکي 4 تايي به صورت : (i - 1 , j ) , ( i + 1 , j ) , ( i , j - 1 ) , ( i , j + 1 )زمينه به مجموعه پيکسل هايي که شامل آبجکت نيستند , يا مجموعه پيکسل هايي که شامل S’ هستند گفته مي شود . ( S’ پيکسل هايي که شامل آبجکت نمي باشند )
اسلاید 7: 7مقدمه اي بر پردازش تصوير اصطلاحاتمسير path ) )2 پيکسل را در يک تصوير باينري در نظر بگيريد . اگر راهي بين اين 2 پيکسل از طريق پيکسل هايي که حاوي آبجکت هسنتد وجود داشته باشد, به پيکسل- هاي مرتبط مسير گفته ميشود .اتصال اگر S مجموع پيکسل هايي باشد که شامل آبجکت هستند پس S’ شامل ييکسل هاي بک گراند است . 2 پيکسل p و q که هر 2 متعلق به S هستند متصل به يکديگرند اگر حداقل يک مسير بين p و q وجود داشته باشد .
اسلاید 8: 8مقدمه اي بر پردازش تصوير اصطلاحاتمرز تصوير ( Border ) کليه پيکسل هايي که در اطراف آبجکت قرار گرفته اند .حفرهمجموعه اي از S’ که حتي يک پيکسل هم در Border نداشته باشد , حفره ناميده مي شود .
اسلاید 9: 9مقدمه اي بر پردازش تصوير اصطلاحاتهيستوگرامهيستوگرام در واقع همان نمودار ميله اي افزوني هر رنگ مي باشد, به عنوان مثال تعداد پيکسل هايي که حاوي رنگ شماره 75 هستند 25 عدد است . از هسيتوگرام براي آستانه گيري استفاده مي شود.آستانه گيري ( Threshold )فرض کنيد مي خواهيد از يک عکس 16 بيتي يک تصوير سياه و سفيد بسازيد . براي اين کار بايد تک تک پيکسل ها را با مقدار مشخصي مقايسه کنيد اگر بزرگتر از آن مقدار مشخص بود به جاي آن رنگ سفيد و اگر کوچکتر بود به جاي آن مقدار سياه قرار مي دهيم . به اين کار آستانه گيري با Threshold مي گويند .
اسلاید 10: 10مقدمه اي بر پردازش تصوير اصطلاحاتمحاسبه مساحت و محيط : فرض کنيد که تصويري از دايره در يک زمينه سفيد رنگ داريد مانند شکل روبرو :براي بدست آوردن مساحت اين دايره فقط کافي است که تعداد پيکسل هايي که مقدار عددي آن صفر است را بشماريد و آن را کاليبره کنيد ( به اين معني که با توجه به فاصله دوربين تا آبجکت , نسبتي بين تعداد پيکسل هاي واقعي آبجکت و تعداد پيکسل هاي تصوير بدست آورد ) . به اين ترتيب به راحتي مي توان مساحت هر آبجکتي را بدست آورد حتي اگر منظم نباشد .براي بدست آوردن محيط دايره مي توان ابتدا شعاع دايره را با استفاده از مساحت آن به دست آورد ( R = S / II ) سپس با استفاده از فرمول P = 2 IIR محيط را محاسبه کرد .
اسلاید 11: 11مقدمه اي بر پردازش تصوير اصطلاحاتنحوه بدست آوردن مرکز تصوير و آبجکت :براي بدست آوردن مرکز تصوير از روش زير استفاده مي شود : به اين معني که تعداد پيکسل هاي ماتريس در سطر و تعداد پيکسل هاي ماتريس در ستون تقسيم بر 2 دقيقا i , j پيکسل مرکز تصوير خواهد بود .براي بدست آوردن مرکز آبجکت بايد به صورت زير عمل کرد : مساحت آبجکت را بدست مي آوريم . براي به دست آوردن مساحت تعداد پيکسل هاي آبجکت را جمع ميکنيم . حال براي بدست آوردن I مرکز آبجکت مقدار j ها را با هم جمع مکنيم. حال براي بدست آوردن j مرکز آبجکت مقدار i هاي پيکسل ها را با هم جمع و تقسيم به مساحت مي کنيم .
اسلاید 12: 12مقدمه اي بر پردازش تصوير اصطلاحاتبه عنوان مثال براي بدست آوردن مرکز آبجکت زير : همانطور که مشاهده مي کنيد مرکز آبجکت 3 و 5 است .
اسلاید 13: 13مقدمه اي بر پردازش تصوير اصطلاحات تشخيص الگو ( Pattern Recognition )فرض کنيد مي خواهيد تشخيص دهيد که آبجکتي که در تصوير است دايره است يا خير . به اين عمل که توسط مغز کامپيتر انجام ميشود تشخيص الگو گفته مي شود .براي اين منظور بايد به دنبال ويژگي منحصر به فردي در دايره باشيم . به عنوان مثال مثلا در مغز انسان , دايره مکان هندسي نقاطي است که فاصله آنها از يک نقطه مشخص از آن در ذهن دارد .در دايره ويژگي منحصر به فرد P2/S = 4R است . البته بايد به اين نکته توجه کرد که منحصر به فرد بودن اين ويژگي در اشکال هندسي و در آبجکت هاي بي شکل صادق نيست . روند تشخيص الگو در کامپيوتر به شکل زير است :
اسلاید 14: 14مقدمه اي بر پردازش تصوير اصطلاحاتشماره گذاري آبجکت هاي درون تصوير براي تشخيص اينکه چه تعداد آبجکت در تصوير وجود دارد و هر کدام از پيکسل هل متعلق به کدام آبجکت است از روش هاي مختلفي استفاده مي شود و به اين عمل Component Labeling يا شماره گذاري اجزاء گفته مي شود . براي اختصار آخرين و سريع ترين الگوريتم موجود را برسي مي کنيم :
اسلاید 15: 15مقدمه اي بر پردازش تصوير اصطلاحاتماتريسي که در صفحه قبل مشاهده مي کنيد يک تصوير به فرض سياو و سفيد است ( رنگ هايي که در تصوير مشاهده مي کنيد براي جدا کردن آبجکت ها است ) در خانه هايي که آبجکتي وجود ندارد مقدار صفر و در پيکسل هايي که آبجکت وجود دارد عدد يک وجود دارد .از سطر اول شروع مي کنيم و آنقدر در سطر حرکت مي کنيم تا به اولين پيکسلي که حاوي مقدار 1 است برسيم , اين پيکسل را به عنوان اولين آبجکت در نظر مي گيريم . کار را ادامه مي دهيم در سطر بعد اولين مقدار 1 که رسيديم همسايه هاي 8 گانه آنرا نگاه مي کنيم . اگر بين پيکسلي که قبلا نشانه گذاري کرده بوديم و پيکسلي که الان به آن رسيديم مسيري وجود داشت , اين 2 پيکسل هر دو از يک آبجکت هستند , پس به اين پيکسل نيز برچسب همان پيکسل قبلي را مي زنيم . کار ادامه پيدا مي کند تا جايي که به پيکسلي ميرسيم که در شکل مشخص شده است که متعلق به آبجکت يک است ولي در همسايگي آن پيکسل برچسب گذاري نشده است .
اسلاید 16: 16مقدمه اي بر پردازش تصوير اصطلاحاتبدون در نظر گرفتن اين موضوع برچسب جديدي را به آن مي زنيم . کار را به همين صورت ادامه ميدهيم ته به پايان برسيم .نکته قابل توجه اينجاست که آبجکت هايي که با 2 برچسب مشخص شده اند در جايي اين 2 پيکسل به هم ميرسند . در بار دوم که ماتريس تصوير را رفرش مي کنيم به محل تلاقي برچسب ها که رسيديم مقدار برچسب کوچکتر را در برچسب هاي بزرگتر قرار مي دهيم . حال با 2 بار رفرش کردن تصوير با فرض سياه و سفيد بودن تصوير مي توان تمامي آبجکت ها را مشخص و جدا کرد .
اسلاید 17: 17مقدمه اي بر پردازش تصوير اصطلاحاتفاصله بين 2 آبجکتمينيمم پيکسل هاي موجود بين 2 آبجکت .کاربرد اين کار به عنوان مثال سرعت سنج اتومبيل در اتوبان ها است.تشخيص لبه در يک تصوير دليل ايجاد بک لبه در تصوير اختلاف شدت نور در 2 طرف آن محل است که به ان لبه مي گوييم .لبه ها قسمتي از تصوير هستند که اشتخوان بندي تصوير را مشخص مي کنند.انواع لبه ها : 1 - لبه عمودي 2 - لبه افقي 3 - لبه مورب
اسلاید 18: 18مقدمه اي بر پردازش تصوير اصطلاحاتبراي يافتن لبه ها به شکل زير عمل مي کنيم : براي لبه هاي افقي از ستون اول به صورت عمودي شروع به حرکت مي کنيم و هر پيکسل را با پيکسل قبل از خودش مقايسه مي کنيم اگر تفاوت آنها از عدد مشخصي بيشتر باشد آنجا لبه است . در غيراين صورت به آن کاري نداريم . يافتن لبه هاي عمودي هم به همين صورت است منتها به صورت افقي شروع به حرکت مي کنيم .لبه هاي مورب ميشه گفت ترکيبي از اين 2 لبه اند به اين صورت که جذر جمع مختصات هر پيکسل بايد از عددي مشخص بيشتر باشد در غير اين صورت لبه نيست .
اسلاید 19: 19مقدمه اي بر پردازش تصوير اصطلاحات بزرگ نماييZoom ): )براي بزرگ نمايي يا کوچک نمايي تصوير الگوريتم هاي مختلفي وجود دارد که ما به ساده ترين آنها اشاره مي کنيم .براي 2 برابر کردن تصوير بين هر سطر و ستون يک سطر و ستون اضافه قرار مي دهيم و مقدار آن را ميانگين 2 پيکسل کناري آن قرار مي دهيم .براي 1/2 کردن تصوير به صورت يکي در ميان سطر و ستون ها را حذف مي کنيم .همين روش را براي N برابر و 1/N برابر کردن استفاده مي کنيم .
اسلاید 20: 20معرفي چند کاربرد كاربردهاي بازشناسي الگو در پردازش تصويرشناسايي الگو ( ادامه ... )شناسايي الگو يکی از شاخه هاي هوش مصنوعي است كه با طبقه بندي (كلاسه بندي) و توصيف مشاهدات سروكار دارد. . شناسايي الگو به ما كمك مي كند تا داده ها (الگوها) را با تكيه بر دانش قبلي يا اطلاعات آماري استخراج شده از الگوها، طبقه بندي نماييم. الگوهايي كه مي بايست كلاسه بندي شوند، معمولا گروهي از سنجش ها يا اهداف هستند كه مجموعه نقاطي را در يك فضاي چند بعدي مناسب تعريف مي نمايند.كاربردهاي بازشناسي الگوبازشناسي الگو در بسياري از زمينه ها نقش كاربردي دارد . بازشناسي حروف، بازشناسي نويسنده، تصديق امضاء، طبقه بندي اثر انگشت و بازشناسي گفتار نمونه هايي از اين كاربردها هستند. شناسايي الگو براي تحليل داد ه هاي پزشكي نيز بكار گرفته شده است.
اسلاید 21: 21معرفي چند کاربرد كاربردهاي بازشناسي الگو در پردازش تصويركاربردهاي بازشناسي الگو براي مثال تفسيرالكتروكارديوگرام، تحليل تصاوير اشعه X و طبقه بندي كروموزم ها را مي توان نام برد. نمونه هاي ديگري از اين كاربردها شامل طبقه بندي مناطق زراعي، مطالعه آلودگي آب ها، آشكار كردن منابع زيرزميني و پيش بيني آب و هواست. در اين نوع كاربردها ، تصاوير ارسال شده از ماهواره و تصاوير هوايي به كمك روش هاي بازشناسي الگو تفسير مي شوند. بازرسي تصويري و بازشناسي قطعات ماشيني، از كاربردهاي صنعتي شناسايي الگو هستند. تحليل بافت ، آشكارسازي هدف در سيگنال هاي برگشتي رادار يا سونار ، طبقه بندي امواج زلزله و تشخيص ذرات شيميائي كاربردهاي ديگري از بازشناسي الگو مي باشند.
اسلاید 22: 22بازشناسي نوري حروف ( OCR )مقدمهمقدمه اي بر پردازش متن افزايش روزافزون توليد اطلاعات كه غالباً به صورت مواد چاپي به بازار عرضه ميگردد و ضرورت دسترسي سريع و آسان به داده هاي موجود از يك سو، و حضور فراگير رايانه در عرصه هاي مختلف زندگي از سوي ديگر، متخصصان فناوري اطلاعات را بر آن داشته كه همواره در پي يافتن راهكار مناسب براي گردآوري و پردازش اطلاعات به كمك رايانه باشند. تبديل اطلاعات متني با مشخصه هاي متفاوت به مستندات متني استاندارد کامپيوتري يکي از راهکارهاي افزايش بازدهي فناوري اطلاعات است. مزيت متن واقعي به ساير اشکال يک مستند بطور خلاصه عبارتند از: متن، قابل ويرايش و جستجو است و به آساني مي توان آنرا پردازش کرد. امکان جستجوي عبارات در يک متن حجيم، امتياز بزرگي است. حجم متن معمولا بسيار کمتر از حجم تصوير مشابه است.به متن ميتوان بسادگي توضيح، فرالينک، و امکانات رسانه مرکب افزود.
اسلاید 23: 23بازشناسي نوري حروف ( OCR )مقدمه (Optical Character Recognition ) OCRهنگامي كه يك سند متني اسكن مي شود، كامپيوتر اين متن را بصورت يك تصوير گرافيكي تشخيص ميدهد. در نتيجه كاربران قادر نخواهند بود كه متن موجود در تصوير سند را ويرايش نمايند و يا آن را مورد جستجو قرار دهند. يك نرم افزار OCR اين متن اسكن شده را خوانده و محتويات آنرا شناسايي نموده، و بصورت يك فايل در كامپيوتر ذخيره مي سازد. چنين قابليتي امكان استفادة گسترده از كامپيوتر را در پردازش سريع حجم وسيعي از داده هاي مكتوب توليد شده توسط شركتها و مؤسسات مختلف نظير بانكها، شركتهاي بيمه، مؤسسات خدمات عمومي، ادارة پست و ساير نهادهايي كه ساليانه با ميليونها مورد پرداخت، دريافت و حسابرسي امور مشتريان خود مواجه اند، فراهم ميآورد. کاربردهاي ديگر آن شامل تبديل کتابها يا اسناد اسکن شده به فايلهاي متني , مرتب کردن چکها در بانکها، خواندن آدرس بستههاي پستي و مرتب کردن خودکار آدرس ها، کمک به افراد نابينا با خواندن متون براي آنها، ارتباط بين انسان و ماشين با استفاده ازتحرير عادي دستي، و بسياري کاربردهاي ديگر ميشود.
اسلاید 24: 24بازشناسي نوري حروف ( OCR ) تاريخچهتاريخچه سيستم هاي OCRاز جنبه تاريخي، سيستمهاي OCR تا كنون مراحل تكاملي زيادي را پشت سر گذاشتهاند : اولين اقدامات صورت گرفته در زمينة بازشناسي حروف, در سالهاي اول دهه 1900 انجام گرفته است که دانشمندان روسي مي خواستند به افراد مبتلا به نارساييهاي بينايي كمك نمايد. اولين اختراعهاي ثبتشده در اين زمينه مربوط به سالهاي 1929 و 1933 ميلادي هستند . اين سيستمها حروف چاپي را با روش تطبيق قالب شناسايي ميكردند. به اين صورت كه ماسكهاي مكانيكي مختلفي از مقابل تصوير حرف عبور ميكردند و نور از يك سو به آن تابانده ميشد و از سوي ديگر توسط يك آشكارساز نوري دريافت ميگرديد. وقتي يك انطباق كامل صورت ميگرفت، نور به آشكارساز نميرسيد و حرف ورودي بازشناسي ميشد . اين اختراع به دليل فناوري پائين مورد استفاده در آن، كاربردي نبود و با ظهور کامپيوترهاي ديجيتال به صورت يك رؤيا باقي ماند .
اسلاید 25: 25بازشناسي نوري حروف ( OCR ) تاريخچهاقدامات اوليه در زمينه OCR، بر متون چاپي يا مجموعه كوچكي از حروف و نمادهاي دستنويس كه براحتي قابل تشخيص بودند متمركز گرديده بود که عمدتاً از روش تطبيق قالب استفاده مينمودند به اين صورت كه در آن تصوير ورودي با مجموعه بزرگي از تصاوير حروف مورد مقايسه قرار ميگرفت . در اين دوره، تحقيقات موفق اما محدود شده (منظور از محدود شده، مفروض دانستن شرايط و پيشفرضهاي خاص براي كاراكترهاي ورودي است)، بيشتر بر روي حروف و اعداد لاتين انجام گرفت. با اين حال مطالعات چندي نيز بر روي حروف ژاپني، چيني، عبري، هندي، سيريليكي، يوناني و عربي در هر دو زمينه حروف چاپي و دستنويس آغاز گرديد . مطالعات صورت گرفته تا قبل از سال 1980 بدليل فقدان سختافزارهاي قدرتمند و دستگاههاي ورودي مناسب با مشكل همراه بودند. اما از دهه 1980 به بعد بواسطه رشد انفجارگونه فناوري اطلاعات، وضعيت بسيار مناسبي براي تحقيقات مختلف از جمله بازشناسي حروف فراهم گرديد .
اسلاید 26: 26بازشناسي نوري حروف ( OCR ) تاريخچهدر اين مقطع زماني بود كه با تكوين ابزارها و تكنيكهاي پردازشي جديد، پيشرفت واقعي در سيستمهاي OCR محقق گرديد. در اوايل دهه 90، روشهاي پردازش تصوير و بازشناسي الگو با تكنيكهاي كارآمد هوش مصنوعي ادغام گشتند. محققان، الگوريتمهاي پيچيدهاي را در بازشناسي حروف ابداع نمودند كه قادر بودند دادههاي ورودي با تفكيكپذيري بالا را دريافت كنند و در مرحله پيادهسازي، محاسبات بسيار زيادي را بر روي دادهها انجام دهند. امروزه علاوه بر وجود رايانههاي قدرتمندتر و تجهيزات الكترونيكي دقيقتر مانند اسكنرها، دوربينها و صفحات رقميكننده، استفاده از تكنيكهاي پردازشي مدرن و توانمند همچون شبكههاي عصبي ، مدلهاي ماركوف پنهان ، منطق فازي، و مدلهاي پردازش زبان طبيعي امكانپذير گشته است .
اسلاید 27: 27بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRدر يك تقسيم بندي كلي ميتوان سيستمهاي OCR را از لحاظ نوع الگوي ورودي به دو گروه تقسيم کرد :سيستمهاي بازشناسي متون چاپيسيستمهاي بازشناسي متون دستنويسهمچنين از جنبه نحوه ورود اطلاعات، سيستمهاي OCR به دو دستة زير تقسيم بندي مي شوند :سيستمهاي بر خطسيستمهاي برون خط
اسلاید 28: 28بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRدر بازشناسي برخط، حروف در همان زمان نگارش توسط سيستم تشخيص داده ميشوند. دستگاه ورودي اين سيستمها يك قلم نوري است. در اين روش علاوه بر اطلاعات مربوط به موقعيت قلم، اطلاعات زماني مربوط به مسير قلم نيز در اختيار است. اين اطلاعات معمو ً لا توسط يك صفحة رقومي كننده اخذ مي شوند. در اين روش مي توان از اطلاعات زماني سرعت، شتاب، فشار و زمان برداشتن و گذاشتن قلم روي صفحه در بازشناسي استفاده كرد.در بازشناسي برون خط، از تصوير دو بعدي متن ورودي استفاده مي شود. در اين روش به هيچ نوع وسيله نگارش خاصي نياز نيست و تفسير داد ه ها مستقل از فرآيند توليد آنها تنها براساس تصوير متن صورت مي گيرد. اين روش به نحوة بازشناسي توسط انسان شباهت بيشتري دارد.
اسلاید 29: 29بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRبخشهاي مختلف يك سيستم OCR کاملالف‐ پيش پردازش : شامل كلية اعمالي كه روي سيگنال تصويري خام صورت ميگيرند تا موجب تسهيل روند اجراي فازهاي بعدي گردند؛ مانند باينري كردن تصوير، حذف نويز، هموارسازي، نازك سازي، تشخيص زبان و فونت كلمات و نظاير اينها.ب‐ قطعه بندي : عبارت است از روش هايي كه بخش هاي مختلفي همچون پاراگراف ها، جملات يا كلمات، و حروف را از تصوير سند استخراج مي نمايند.ج‐ استخراج ويژگي ها : مجموعة كلية محاسباتي است كه روي الگوهاي بدست آمده از مرحلة پيش پردازش انجام ميشود تا بردار ويژگي هاي متناظر با هر الگو تعيين گردد.
اسلاید 30: 30بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRد‐ بازشناسي با يك يا چند طبقه بندي كننده : شامل روش هايي براي متناظر ساختن هر يك از الگوهاي بدست آمده از مرحلة استخراج ويژگي ها با يكي از كلاس هاي فضاي الگوهاي مورد بحث است كه از طريق كمينه ساختن فاصلة بردار ويژگي هاي هر الگو نسبت به يكي از بردارهاي مرجع موجود در پايگاه داده هاي سيستم انجام مي گيرد.ه - بكارگيري اطلاعات جانبي (پس پردازش) : مانند مجموعه لغات معتبر، اطلاعات آماري مربوط به رخداد حروف، اطلاعات دستوري و معنايي.
اسلاید 31: 31بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRسيستم هاي OCR فارسيمسئلة بازشناسي حروف الفباي فارسي سابقهاي نه چندان طولاني به همراه دارد. نخستين گزارشهاي رسمي منتشر شده از تلاشهاي انجام گرفته در اين راه، مربوط به ساليان نخست دهة ۱۹۸۰ ميلادي است به رغم فراگيري نسبي كاربرد الفباي فارسي در ميان ملل مختلف قارة آسيا، بررسيهاي انجام شده در خصوص يافتن روشهايي براي بازشناسي حروف اين الفبا بسيار محدود بوده است. بواسطة وجود تفاوتهاي اساسي بين نحوة نگارش كلمات فارسي و كلمات لاتين نظير چسبيده بودن حروف سازندة يك كلمه به يكديگر و تغيير شكل حروف بر اساس موقعيت نسبي قرارگيري آن در يك كلمة فارسي، امكان اعمال مستقيم روشهاي متداول در بازشناسي حروف انگليسي بنظور شناسايي حروف تشكيل دهندة كلمات فارسي وجود ندارد.
اسلاید 32: 32بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRدر حال حاضر يکی از نرم افزار تجاري كارآمد OCR که زبان فارسي را پشتيباني مي کند Automatic Reader محصول شرکت عربي Sakhr است که داراي 2 نخسه Gold و Platinum ميباشد . در حال حاضر قيمت نسخه 0.7 آن 4000 و 1400 دلار است .اين رقم در مقايسه با قيمت نرم افزار هاي معروفي همچون Office که حداکثر 600 دلار مي باشد واقعًا قابل ملاحظه ميباشد .همچنين شركت جيحونافزار” يک نرم افزار OCRفارسي بنام “شناسا” (ShenAsA) داشت كه قيمت آن در سال ۱۹۹۶ حدود ۱۰۰۰ دلار بود اما ظاهرًا از كارايي چندان مورد قبولي برخوردار نبود چون متاسفانه حاصل فارسي سازي سطحي نسخه هاي قبلي و فعلي محصولات صخر هستند که در مواردي تنها به فارسي سازي منوها اکتفا شده است .نرم افزار ديگری به نام Readiris Pro 11 Middle East به تازگی منتشر شده که زبان فارسی را هم پشتيبانی مي کند.
اسلاید 33: 33بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRدر نسخه هاي پيشين اين نرم افزار زبان فارسي وجود نداشت و تنها با استفاده از امکان عربي آن ميشد پردازش ناقصي انجام داد . اين نرم افزار با قيمت 300.000 دلار به فروش رسيد !به دلايل گفته شده OCR درمرحلة كنوني در كشور ما مربوط به «دستنويسهاي گسسته» يا متنهاي تايپي پيوسته است، و تا بازشناسي متنهاي دستنويس پيوسته توسط كامپيوتر راه زيادي در پيش است، چون در دستنويسهاي گسسته، اگرچه حروف به هم شباهت دارند، حداقل جداجدا نوشته شدهاند. در متنهاي پيوسته تايپي هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم. البته به گفته مسئولان شركت «پايا» در حال حاضر هم نرمافزارهايي وجود دارد كه متن دستنويس پيوسته را تبديل به حروف جدا ازهم و گسسته ميكنند، ولي ضريب خطاي اين نرمافزارها زياد است و به شكل صنعتي درنيامدهاند. نرم افزار های ديگر : Omni Page Pro 12 - ABBYY FineReader - Text Bridge
اسلاید 34: 34بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRمشکلات و پيچيدگي هاي پيش روي OCR هاي فارسي و عربي نگارش فارسي، ويژگيهاي منحصر به فردي دارد كه آن را كاملاً از نگارش لاتين متمايز ميسازد. به منظور فعاليت در حوزه OCR فارسي، آگاهي از قوانين نگارشي و نحوه چاپ حروف در اين زبان، امري ضروري است :در كلمات فارسي برخي از حروف از يك يا دو طرف به حروف مجاور خود اتصال دارند و برخي نيز به صورت مجزا نوشته ميشوند. در نتيجه هر كلمه ممكن است شامل يك يا چند بخش متصل باشد كه «زيركلمه» ناميده ميشوند. چسبيده يا سرهم بودن حروف در نگارش فارسي، بازشناسي متون فارسي را براي سيستمهاي OCR، نسبت به متون لاتين بسيار مشكلتر ميسازد.حروف فارسي ممكن است چهار موقعيت مجزا و در نتيجه چهار شكل متفاوت نگارش داشته باشند: حروف ابتدايي، مياني، انتهايي و مجزا. نهايتا حدود 100 شکل مختلف حرف و عدد در مجموعه تشخيص وجود خواهند داشت.
اسلاید 35: 35بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRحروف واقع در يك كلمه ممكن است همپوشاني داشته باشند، بدين معنا كه نتوان با رسم خطوط عمودي، حروف را به طور كامل از يكديگر مجزا نمود.متون فارسي برخلاف متون لاتين از راست به چپ نوشته ميشوند.در برخي از فونتها بعضي از حروف، از يك سمت در دو محل به يكديگر اتصال دارند.برخي از حروف بين يك تا سه نقطه دارند كه ممكن است در بالا يا پايين بدنه حرف واقع باشند.بعضي از حروف بدنه مشابه دارند و تفاوت آنها تنها در تعداد و محل قرارگيري نقاط يا در وجود يك سركش است (مانند «ك» و «گ») كه در مقايسه با بدنه حروف، اندازه بسيار كوچكي دارند. اين موضوع نيز يكي از مواردي است كه بر پيچيدگي سيستمهاي OCR فارسي ميافزايد.حروفي كه از طرف چپ قابليت اتصال به حرف مجاور خود را دارند، ممكن است به صورت كشيده نوشته شوند.
اسلاید 36: 36بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRحروف فارسي ممكن است در بالا يا پايين بدنه داراي اعراب باشند. سه اعراب -َ -ِ -ُ در زبان فارسي، اعرابهاي اصلياند و اعراب -ً در برخي كلمات عربي رايج در زبان فارسي ديده ميشود (نظير كلمات «عمداً» و «احتمالاً»). كلمات عربي داراي اعراب -ٌ و -ٍ در زبان فارسي عموميت نيافتهاند. هر چند كاربرد اعراب در زبان فارسي نسبت به زبان عربي بسيار محدودتر است، اما اگر كلمهاي نامتداول باشد يا به دليل تشابه نگارشي آن با كلمه ديگر، تأكيد بر تلفظ صحيح آن باشد، از نشانههاي اعراب استفاده ميشود. ضمنا در بالاي بدنه يك حرف ممكن است علامت تشديد وجود داشته باشد و برخي از حروف داراي علامت همزه هستند.دربارة اعداد فارسي هم اين مشكل وجود دارد: صفر ما تنها يك نقطه كوچك است كه ميتواند سيستم را به اشتباه بيندازد؛ اعداد 4، 3، 2، 1 هم بسيار به هم شبيه هستند و تنها تفاوتشان در دندانه ها است.در متون دستنويس فارسي، تنوع تحرير بسيار زياد است. انواع شکلها براي حروفي مانند س ، ي ، ها و غيره متصور است. در تحرير دستنويس از سوي ديگر مشخصه هاي حرکت قلم نيز قابل تحليل هستند.
اسلاید 37: 37بازشناسي نوري حروف ( OCR ) بررسي اجزا و انواع سيستم OCRبيشتر حروف فارسي (مخصوصاً حروف چسبيده) دندانهدار هستند. در مواردي كه كيفيت سند اصلي يا دستگاه اسكنر پايين باشد، ارتفاع دندانهها نسبت به خط زمينه كوتاه ميشود و اين امر، شناسايي صحيح اين حروف در مرحله قطعهبندي يا بازشناسي را با مشكل مواجه ميسازد.
اسلاید 38: 38بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR تحليل بخشهاي مختلف سيستمهاي OCRپيش پردازشاين مرحله شامل كلية پردازشهايي است كه بر روي سيگنال هاي تصويري خام انجام مي شوند تا موجب تسهيل يا افزايش دقت روند اجراي فازهاي بعدي گردند. از مجموعة اين پردازشها هدفهاي زير دنبال مي شود :۱‐ كاهش نويز.۲‐ نرماليزه نمودن داده ها.۳‐ فشرده سازي ميزان اطلاعاتي كه مي بايست محفوظ بماند.
اسلاید 39: 39بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR كاهش نويزنويز ايجاد شده بواسطة دستگاه هاي اسكنر نوري يا ابزارهاي نگارشي منجر به ايجاد قطعه خط هاي گسسته، اتصال بين خطوط، فضاهاي خالي در خطوط متن، پر شدن حفره هاي موجود در تصوير برخي حروف و غيره مي گردد. همچنين اعوجاج هاي مختلف شامل تغييرات محلي، منحني شدن گوشه هاي حروف، تغيير شكل و يا خوردگي حروف را نيز بايستي مد نظر قرار داد. قبل از مرحلة بازشناسي حروف لازم است كه اين نقايص برطرف شوند. تكنيك هاي مختلف كاهش نويز را مي توان به سه گروه اصلي دسته بندي نمود : الف‐ فيلتر كردنب‐ عملگرهاي مورفولوژيج‐ مدلسازي نويز
اسلاید 40: 40بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR كاهش نويز
اسلاید 41: 41بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR نرماليزه كردن داده هاروش هاي نرماليزه كردن داده ها به حذف تغييرات نگارشي كمك نموده، داده هاي استاندارد شده اي را نتيجه مي دهد. روش هاي پاية نرماليزه كردن عبارتند از:الف‐ نرماليزه كردن كجي متن و استخراج خطوط زمينهب‐ نرماليزه كردن اريب شدگيج‐ نرماليزه كردن (تغيير مقياس دادن) اندازهد‐ هموارسازي كانتورهر کدام از اين مباحث به تنهايي قابل بحث و شرح مي باشند که ما در اين بحث به خلاصه اي از هر کدام از اين موارد مي پردازيم .
اسلاید 42: 42بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR الف - نرماليزه كردن كجي متن و استخراج خطوط زمينهبديل عدم دقت در مرحلة اسكن و يا بي دقتي نويسنده در هنگام نگارش متن دستنويس، ممكن است خطوط متن نسبت به تصوير اندكي انحراف يا چرخش داشته باشند , اين مسئله مي تواند كارايي الگوريتم هاي بكار رفته در طبقات بعدي سيستم OCR را تأثير قرار دهد, چرا كه يكي از مفروضات بيشتر روشهاي قطعه بندي، عدم كج بودن تصوير متن ورودي است و در نتيجه لازم است كه اين نقيصه آشكار و تصحيح گردد. آشكارسازي خط زمينه در بسياري از تكنيكهاي قطعه بندي و بازشناسي متون فارسي، عربي و لاتين نقش اساسي دارد. علاوه بر اين، برخي از كاراكترها را ميتوان بواسطة موقعيت نسبيشان نسبت به خط زمينه آشكار ساخت.
اسلاید 43: 43بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR روش هاي بكار رفته جهت تصحيح كجي خطوط زمينه در متون لاتين عبارتند از :۱‐ بكارگيري هيستوگرام ( پروفايل تصويرنمايي ) تصوير۲‐ استفاده از روش خوشه بندي نزديكترين همسايه ها ۳‐ روش همبستگي متقابل بين حروف۴‐ تبديل هاف
اسلاید 44: 44بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب‐ نرماليزه كردن اريب شدگيدر متون چاپي فارسي و لاتين ، كاراكترهاي داراي فرمت ايتاليك از راستاي عمود انحراف دارند. همچنين در متون دستنويس برخي از نويسنده ها حروف را بصورت زاويه دار مي نويسند. اين شناخته مي شود و مي تواند دقت برخي از الگوريتم هاي قطعه بندي « اريب شدگي » پديده تحت عنوان يا بازشناسي را تحت تأثير قرار دهد و لذا در اين سيستم ها لازم است كه در مرحلة پيش پردازش ، ميزان اريب بودن كاراكترها شناسايي و تصحيح گردد.اريبشدگي بصورت زاوية شيب بين طويل ترين زيرحرف در يك كلمه و جهت عمودي تعريف مي شود. نرماليزه كردن اريب، بنظور نرماليزه نمودن كلية كاراكترها به يك فرم استاندارد بكار مي رود. معمول ترين روش در تخمين ميزان اريب شدگي، محاسبة زاوية متوسط اجزاء نزديك به خط عمود است . استخراج خطوط عمودي از كاراكترها بوسيلة يك جفت فيلتر يك بعدي انجام مي پذيرد. مختصات شروع و پايان هر خط، زاوية اريب را بدست مي دهد.
اسلاید 45: 45بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ج‐ نرماليزه كردن (تغيير مقياس دادن) اندازهدر سيستم هاي OCR اغلب تصاوير كلمات خيلي كوچك يا خيلي بزرگ، به يك اندازة استاندارد نرماليزه مي شوند. اين عمل معمو لا با نمونه برداري مجدد ٢ تصوير انجام ميگيرد. روش هايي نظير Bilinear يا Bicubic بر روي تصاوير سطح خاكستري بنحو مناسبي عمل ميكنند , اما عمليات نمونه برداري موجود در آنها ، كاراكترهاي دوسطحي را دچار اعوجاج مي سازند. يك راهكار استاندارد ، اعمال يك روال دو مرحله اي است كه در آن ابتدا كانتور هموار اصلي مربوط به كاراكتر نمونه برداري شده، توسط يك فيلتر كانولوشن وزندار ١ و كوانتيزاسيون دوسطحي دامنه ٢ تقريب زده مي شود و پس از آن عمل نمونه برداري مجدد انجام مي گيرد . روش هاي بازشناسي حروف ممكن است نرماليزه كردن اندازه را در هر دو جهت افقي وعمودي انجام دهند. در هر كاراكتر به تعدادي ناحيه تقسيم ميشود و هر يك از اين نواحي ، بصورت جداگانه تغيير مقياس داده مي شوند.
اسلاید 46: 46بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR د‐ هموارسازي كانتوردر متون دستنويس، بواسطة لرزش يا حركات ناخواستة دست نويسنده هنگام نگارش، ممكن است كه كانتور حروف شكل ناصاف پيدا كند. همچنين اين مسئله ميتواند در سيستمهاي بازشناسي متون چاپي و دستنويس بدليل تغيير مقياس حروف و يا وجود نويز در مرحلة اسكن تصاوير نيز ظاهر گردد. روشهاي هموارسازي كانتور بمنظور جبران اين نقيصه مورد استفاده قرار ميگيرند. بطور كلي هموارسازي كانتور تعداد نقاط نمونة مورد نياز براي بازنمايي كاراكتر را كاهش ميدهد و در نتيجه كارايي مراحل پردازشي باقيمانده را بهبود مي بخشد. در مقدار هر پيكسل از تصوير متن با مقدار ميانگين وزني پيكسل هاي همساية آن جايگزين ميشود كه با دو بار تكرار اين عمل، تصوير هموارتري از متن دستنويس بدست ميآيد و در نتيجه اثر لرزش دست نويسنده كاهش پيدا ميكند .
اسلاید 47: 47بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR فشرده سازياين مسئله پذيرفته شده است كه تكنيكهاي كلاسيك فشرده سازي تصاوير كه تصوير را از حوزة مكاني به حوزه هاي ديگر منتقل مي كنند، براي بازشناسي حروف مناسب نمي باشند. در بازشناسي حروف، عمل فشرده سازي نيازمند آن دسته از تكنيك هاي حوزة مكاني است كه اطلاعات شكلي را حفظ مي نمايند. دو تكنيك متعارف فشرده سازي، يكي تكنيك اعمال سطح آستانه بمنظور باينري كردن تصاوير سطح خاكستري متون و ديگري نازك سازي مي باشد .الف‐ باينري (دوسطحي) كردن تصوير متن :بمنظور كاهش حجم ذخيره سازي مورد نياز و افزايش سرعت پردازش، اغلب مطلوب است كه با انتخاب يك سطح آستانه، تصاوير سطح خاكستري يا رنگي را به تصاوير باينري تبديل نمود.
اسلاید 48: 48بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب‐ نازك سازياين عمل درحاليكه كاهش قابل ملاحظه اي در حجم داده ها ايجاد ميكند، اطلاعات شكلي كاراكتر را نيز استخراج مي نمايد. دو روش پايه براي نازكسازي عبارتند از « نازكسازي از طريق پيكسل » , « نازكسازي غير از طريق پيكسل » . نازكسازي از طريق پيكسل بصورت محلي و تكراري تصوير را مورد پردازش قرار مي دهد تا وقتي كه از تصوير كاراكتر تنها اسكلت آن به عرض يك پيكسل باقي بماند. اين روش نسبت به نويز بسيار حساس بوده، ممكن است تصوير كاراكتر را مخدوش سازد. از سوي ديگر ، روش هاي نازك سازي غير از طريق پيكسل ، طي فرايند نازك سازي مقداري از اطلاعات سراسري دربارة كاراكتر را مورد استفاده قرار مي دهند.
اسلاید 49: 49بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب‐ نازك سازي
اسلاید 50: 50بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR قطعه بنديمرحلة پيش پردازش يك تصوير اصلاح شده از سند را نتيجه مي دهد بگونه اي كه مقدار كافي از اطلاعات شكلي، فشرده سازي بالا و نويز نويز پايين، از تصوير نرماليزه شدة سند قابل حصول يك مرحلة بسيار با اهميت در بازشناسي حروف مخصوصًا حروف است. قطعه بندي فارسي و عربي كه بصورت پيوسته نوشته مي شوند مي باشد , چرا كه نتيجة بدست آمده از جداسازي كلمات ، خطوط يا كاراكترها مستقيمٌا بر روي نرخ بازشناسي سيستم تأثير مي گذارد.قطعه بندي غلط كاراكترها ، عامل بسياري از خطاهاي OCR است ميزان دقت يك الگوريتم قطعه بندي به سبك نگارش حروف ، كيفيت دستگاه پرينت و نيز نسبت اندازة فونت به رزولوشن دستگاه اسكنر بستگي دارد .دو نوع قطعه بندي وجود دارد :الف) قطعه بندي بيروني ب) قطعه بندي دروني
اسلاید 51: 51بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR الف - قطعه بندي بيروني : قطعه بندي بيروني كه عبارت است از جداسازي بخش هاي مختلف نگارش مانند پاراگراف ها ، جملات يا كلمات .اين مرحله بحراني ترين و حساس ترين قسمت در زمينة آناليز اسناد ميباشد و يك مرحلة ضروري براي سيستم هاي بازشناسي حروف برونخط محسوب ميشود. گر چه مبحث آناليز اسناد با روش ها و تكنيك هاي خاص خود يك حوزة تحقيقاتي تا حدي متفاوت نسبت به OCR است , ليکن تقسيم بندي تصوير سند به نواحي متني و غير متني، يك بخش لاينفك نرمافزارهاي OCR به حساب ميآيد.
اسلاید 52: 52بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب - قطعه بندي دروني : قطعه بندي دروني كه منظور از آن ، جداسازي حروف كلمات مخصوصٌا در مورد كلمات سر هم نوشته شده در متون لاتين و يا رسمالخط هاي پيوسته نظير فارسي و عربي است . عليرغم فعاليت هاي چشمگير دهة گذشته و تنوع تكنيك هاي معرفي شده ، قطعه بندي متون پيوسته ( بخصوص متون دستنويس پيوسته ) به حروف هنوز هم بصورت يك مسئله باقي مانده است. روشه اي قطعه بندي حروف به سه دسته تقسيم مي شوند:الف‐ قطعه بندي صريحب‐ قطعه بندي ضمني ج) تكنيك هاي ادغام شده
اسلاید 53: 53بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR الف‐ قطعه بندي صريحدر اين روش قطعات بر مبناي خاصيت حرفسان بودنشان (شباهت داشتن به يك حرف) . تشخيص داده مي شوند. فرآيند قطعه بندي تصوير به اجزاء بامعني يك نام خاص دارد : تشريح .تشريح فرايندي است كه يك تصوير را بدون بكارگيري يك كلاس بخصوص از اطلاعات شكلي تحليل مينمايد. معيار سنجش خوب بودن قطعه بندي، هم خوان بودن خواص عمومي قطعات با خصوصيات مورد انتظار براي كاراكترهاي معتبر است. تكنيكهاي موجود مبتني بر تشريح يك تصوير عبارتند از : استفاده از فضاهاي خالي و نقاط اوج، آناليز تصويرنمايي عمودي، آناليز اجزاءپيوسته و علائم مشخصه . علاوه بر اين، ميتوان با بكارگيري قراين زبانشناختي، قطعه بندي صريح را در معرض ارزشيابي قرار داد.
اسلاید 54: 54بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب‐ قطعه بندي ضمنياين روش قطعه بندي بر پاية بازشناسي است و تصوير سند را براي يافتن اجزايي كه با كلاس هاي از قبل تعريف شدهاي مطابقت داشته باشند، مورد جستجو قرار ميدهد. قطعه بندي، بر مبناي ميزان صحت نحوي يا معنايي نتايج كلي حاصله از بازيابي انجام مي گيرد. در اين رويكرد، دو ( گروه از روش ها قابل بكارگيري مي باشند ) روش هايي كه چندين روال جستجو را انجام مي دهند و روش هايي كه بردار ويژگي تصوير را قطعه بندي مينمايند.كلاس نخست سعي در قطعه بندي كلمات به حروف يا ساير اجزاء بدون استفاده از الگوريتم هاي تشريح مبتني بر ويژگي دارد. به عبارت دقيقتر، در اين روش بدون در نظر گرفتن محتوا، تصوير بطور اصولي به قسمتهاي همپوشان تقسيم مي شود. از ديدگاه مفهومي، اين دسته روش ها از تكنيك هايي كه براي بازشناسي كلمات چاپي توسعه داده شده اند، نشأت مي گيرند.
اسلاید 55: 55بازشناسي نوري حروف ( OCR ) تحليل بخشهاي مختلف سيستمهايOCR ب‐ قطعه بندي ضمني ( ادامه .. )كلاس دوم از روش هاي قطعه بندي ضمني، تصوير را با كلاسه بندي زيرمجموعه هايي از ويژگي هاي مكاني (استخراج شده از كل تصوير) بطور ضمني قطعه بندي مي نمايد. اين خانواده از روش هاي مبتني بر بازشناسي، از تكنيك هاي ملايم سازي احتمالاتي، مفهوم نقاط منتظم و نقاط تكين، و تطابق بازگشتي استفاده مي نمايند.ج - تكنيكهاي ادغام شدهاين تكنيك ها، روش هاي قطعه بندي صريح و ضمني را در هم ميآميزند. يك الگوريتم تشريح با هدف قطعه بندي اضافي به تصوير اعمال مي شود , بدين معني كه تصوير آنقدر به نواحي مختلف برش داده مي شود تا اطمينان حاصل گردد كه مرزهاي قطعه بندي صحيح نيز در ميان قطعات ايجاد شده موجود مي باشند. پس از حصول اطمينان، قطعات ايجاد شده توسط تكنيك هاي كلاسه بندي مورد ارزيابي قرار مي گيرند تا از ميان آنها قطعه بندي بهينه استخراج گردد.
خرید پاورپوینت توسط کلیه کارتهای شتاب امکانپذیر است و بلافاصله پس از خرید، لینک دانلود پاورپوینت در اختیار شما قرار خواهد گرفت.
در صورت عدم رضایت سفارش برگشت و وجه به حساب شما برگشت داده خواهد شد.
در صورت بروز هر گونه مشکل به شماره 09353405883 در ایتا پیام دهید یا با ای دی poshtibani_ppt_ir در تلگرام ارتباط بگیرید.
- پاورپوینتهای مشابه
نقد و بررسی ها
هیچ نظری برای این پاورپوینت نوشته نشده است.