صفحه 1:

صفحه 2:
نام دا عنوان پروژه : تمقیق و بررسي کاربرد هاي پردازش تصویر واهد درسي : درس كرافيك كامبيوتري استاد مشاور : جناب آقاي دکتر درفشان استاد پاهنما :جناب آقاي دکتر درفشان تهیه کنندگان : مسن مباري 83912515661 امین ثابت قدم اصل 83912515760

صفحه 3:
اهداف % مقدمه‌ااي‌تابرتاپردازشاتصویر ااتعریف[اصطلاحات ۴ 1110]چنداکا ربرد100000100000101000 ‎(ORC ) 000001۳10 ۴‏

صفحه 4:
مقدمه اي بر پردازش تصویر هه ** مقدمه اي بر پردازش تصویر در هر سيستمي و با هر عملگردي براي تصميم كيري به داده هاي ورودي احتياج داريم. اين ورودي ها میتواند از یک سنسور صوتي, سنسور فاصله سنج , ستسور مادون قرمز , میگروفن و با تصاویر رساليا[ یه دوزیین باشد. امروزه پردازش تصویر بهترین ابزار براي استخراج ميژگي ها و تحلیل مجقعیت و در تهایت تصمیم گيري صحیح مي باشد. در مورد آنسان نیز به همین مورت است, اطلاعات از طریق چشم به مغز ارسال مي شوند و مغز با پدازش این اطاعات تصمیم ‎Gules‏ را کرفته و قرمان را صادر مي کند. ‎baw‏ از پدازش تصویر پیاده سازي عملکرد ذهن انسان در قبال داده ها و انجام يردازش هاي خاصي براي استغراج ويژگي مورد نیز ‎ ‏براي رسيدن به هدف از بيش تعيين شده مي باشد. ‎

صفحه 5:
مقدمه اي بر پردازش تصویر امطامات - چند تعریف * یه كوهكترين جزء ‎PIXEL‏ است . بيكسل ‎Picture Element cade‏ به معني المان تصویر است. یک تصویر متشکل از تعداد زيادي بيكسل است كه در كتار هم قرار كرفته اند . در واقع زماتي كه با يك دوربين ديجيتال عكس مي آكيريد اكر رزولوشن دوربين شما 640480 باشد به اين معني است كه ماتريس با ابعاد 640480 در افتيار شماست که 640 بيكسل در طول و 480 بيكسل در عرض دارد . به ازاي هر بيكسل يك سلول نوري در دوربين. وجود دارد. شدت نور اين سلول نوري مقدار عددي را براي اين بيكسل تعيين مي كند. به طور مثال به ازاي رنک سياه مقدار صفر در ييكسل ذخيره مي شود و به ازأي رنك سفيد مقدار 255 در آن ذفیره مي شود

صفحه 6:
مقدمه اي بر پردازش تصویر ‎latina!‏ * همسايكي: 2 نوع ممسايكي وجود دارد : > همسايكي 8 تابي به صورت : := كت ‎ato? a‏ ‎bE i213 da Gd TMF TO LD)‏ 110 60۱0۱0۱ 20 1 > همسايكي 4 تايي به صورت : 32 ‎AL‏ a =e Cid Gd Medi Di ‏إميله‎ + به مجموعه پیکسل هايي که شامل آبمکت نیستند ,یا مجموع» پیکسل هايي که شامل 5 مستند كفته مي شود . ( 15 پیکس هايي که شامل آبمکت نمي باشند)

صفحه 7:
مقدمه اي بر پردازش تصویر اصطامات 00 C(path ys * 2 پیکسل را در یک تصویر باينري در نظر بكيريد . مسيرر دم اک راهي بین این 2 پیکسل از طریق پیکسل هايي که هاوي آبمکت هستتد ومود داشته باشد, به پیکسل- هاي مرتبط مسیر کفته میشود. 1 سل اکر 5 مجموع پیکسل هايي باشد که شامل آبجکت هستند پس 5 شامل بیکسل هاي بک کراند است . 2 پیکسل 2 9 ‎٩‏ که هر 2 متعلق به 5 هستند متصل به يكديكرند اکر مداقل یک مسیر بین 2 و 9 ومود داشته باشد

صفحه 8:
مقدمه اي بر پردازش تصویر امطامات (Border )yeatye + کلیه پیکسل هايي كه در اطاف آبهکت قررگرفته اند . © مره اعه اي از ‎Gy gis 05'S‏ پیکسل ‎ge)‏ رات هم در 80۲06۲ نداشته باشد , هفره = نامیده مي شود )1 (2 \ ‎ana)‏ هفره

صفحه 9:
مقدمه اي بر پردازش تصویر امطامات هيستوكرام در واقع همان نمودار میلم اي افزوتي هر رنک مي باشد. به عنمان مثال تعداد پیکسل هايي که حاوي رنک شماره 75 هستند 25 عدد = است . از مسیتوگرم براي آستانهکيري استفاده - مي شود. | 0 4 a + آستانه گیي ( ‎(Threshold‏ فرض كنيد مي فواهيد از يك عكس 16 بيتي يك تصوير سياه و سفيد بسازيد . براي اين كار بايد تك تك پیکسل ها را با مقدار مشخصي مقايسه كنيد اكر بزركتر از آن مقدار مشخص بود به جاي آن رنك سفيد و اكر كومكتر بود به جاي آن مقدار سياه قرار مي دهیم . به این کار آستانه کيري با 110۳6519010 مي کویند.

صفحه 10:
مقدمه اي بر پردازش تصویر امطامات * . مماسبه مسامت و ممیط: افرض كنيد كه تصويري 1[ دايره در یک [میته سفید نک دارید مانند شکل رویرو ء © براي بدست آوردن مسامت این دایرهفقط كاقي است که تعداد پیکسل هايي که مقدار عددي آن مفر است را بشمارید و آن را كاليبره كنيد ( به اين معني كه با توجه به فاصله دوربين تا آبجكت , نسبتي بين تعداد بيكسل هاي واقعي آبجكت و تعداد ييكسل هاي تصوير يدست آورد ) . به اين ترتيب ‎Gish a‏ مي توان مسامت هر آبجكتي را بدست آورد حتي اكر منظم نباشد . براي بدست آوردن محيط دايره مي توان ابتدا شعاع دايره را با استفاده از مساحت آن به دست آورد 5/1 ) سپس با استفاده از فرمول ۱۱5 2 - 8 محيط را مماسيه كرد - 10

صفحه 11:
مقدمه اي بر پردازش تصویر امطامات ** 2 ."نموه بست آوردن مرکز تصویر و آبجکت : >0 براي بدست آوردن مرکز تصوی از روش زیر استفاده مي شود : به این معني که تعداد پیکسل هاي ماتریس در سطر و تعداد پیکسل هاي ماتریس در ستون تقسیم بر 2 دقیقاز , آ پیکسل مرکز تصویرخواهد بود. > براي بدست آوردن مركز آبمكت بايد يه صورت زير عمل كرده امت آبهکت را بدست مي آوريم . براي به دست آوردن مسامت تعداد پیکسل هاي آبمکت را لیم .ال براي بست آوردن | مرکز آبهکت مقدر زها را با هم جمع مكنيم. مال براي بدست آوردن رز ‎gle i adie cgi‏ پیکسل ها را با هم جمع و تقسیم به مسامت مي کنیم . 11

صفحه 12:
مقدمه اي بر پردازش تصویر اصطلامات ** 0 به عنوان مثال براي بدست آوردن مركز آبمكت زيره 12 مه ده | 0.2 ]0,1

صفحه 13:
مقدمه اي بر پردازش تصویر امطامات (Pattern Recognition ) ‏تشنیص الکو‎ + فرض كنيد مي خواهيد تشخيص دهید که آيبکتي که در تصویر است دایره است یا غیر . به این عمل كه توسط مغز کامپیترانمام میشود تشفیص الکو کفته مي شود . براي اين منظور بايد به دنبال ويزكي منحصر به فردي در دايره باشيم . به عنوان مثال مثلا در مغز انسان , دایره مکان هندسي نقاطي است که فاصله آنها از يك نقطه مشخض ا[ آن در ذهن دارد . در دایره ويژگي منعصر به فرد 48 < 2/5 است . البته بايد به اين نكته توجه كرد كه منمصر به فرد بجدن این ويژگي در اشکال هندسي و در آبمكت هاي بِي شكل صادق نيست . > وند الكو در کامپیوتر به شکل زیر است + يت بيه يدرف أ ‎Stet)‏ 13

صفحه 14:
مقدمه اي بر پردازش تصویر امطلمات ** شماره كذاري آبمكت هاي درون تصوير براي تشخيص اينكه جه تعداد آبجكت در تصوير وجود دارد و هر كدام از بيكسل مل متعلق به كدام آبجکت است از روش هاي مختلفي استفاده مي شود و به این عمل 1۵061189 6۵۴0۵0060۴ یا شماره كذاري اجزاء كفته مي شود . براي اختصار آخرين و سريع ترين الكوريتم. موجود را برسي مي کنيم : 14

صفحه 15:
مقدمه اي بر پردازش تصویر امطامات ماتريسي که در صقمه قبل مشاهده مي كنيد يك تصوير به فرض سياو و سقيد أست [ رنک هايي که در تصویر مشاهده مي کنید براي جدا كردن آبجكت ها است ) در غانه هايي که آبجکتي وجود ندارد مقدار صفر و در پیکسل هايي که آبمکت وجود دارد عدد یک ومود درد . از سطر امل شروع مي کنیم و آنقدر در سطر مرکت مي کنیم تا به اولین پيكسلي که هاوي مقدار 1 است برسيم , اين ييكسل را به عنوان اولين آبجكت در نظر مي كيريم . كاز را ادامه مي دهيم در سطر بعد اولین مقدار 1 كه (سيديم عمسايه هاي 8 كانه آنرا نكاه مي كنيم . اکر بین پيكسلي كه قبلا نشانه كذاري كرده بوديم و ييكسلي كه الان به آن (سيديم مسيري وجود داشت , این 2 پیکسل هر دو از یک آبجکت هستند . پس به اين ييكسل نيز بريسب همان ييكسل قبلي زا مي زنيم . كار ادامه ييدا مي كند تا ماي كه به پيكسلي ميرسيم كه در شكل مشخص شده است كه متعلق به آبمكت يك أست ولي در عمسايكي آن ييكسل بروسب ككاري تشده است ‏ 15

صفحه 16:
مقدمه اي بر پردازش تصویر امطامات بدون در نظر گرفتن این موفوع برچسب مديدي ( به آن مي زنیم . کار به همین صورت ادامه میدهیم ته به پایان برسیم . نکته قابل توجه اینجاست که آبمکت هايي که با 2 برهسب مشقص شده اند در جايي این 2 پیکسل به هم میرستد . د بر دوم که ماتریس تصویر را رفرش مي کنیم به محل تلقي برچسب ها که رسیدیم مقداربرچسب كومكتر را در بريسب هاي يزركتر قرار مي دهیم . مال با 2 بار رفرش كردن تصوير با فرض سياه و سفيد بودن تصوير مي توان تمامي آبجكت ها را مشخص و مدا کرد . 16

صفحه 17:
مقدمه اي بر پردازش تصویر امطامات + قاصله بین 2 آیبکت مینیمم پیکسل هاي مومود بین 2 آیمکت . كاربرد اين كار به عنوان مثال سرعت سنع اتومبيل در اتوبان ها است. 2 تشفيص لبه دريك تصوير دليل ايجاد بك لبه در تصوير اختلاف شدت نور در 2 طرف آن محل است که به أن لبه مي كوييم .لبه ها قسمتي از تصوير مستند كه اشتفوان بندي تصویر(! مشفص مي کنند. 17

صفحه 18:
مقدمه اي بر پردازش تصویر امطامات ** براي يافتن لبه ها به شكل زير عمل مي كنيم : > براي لبه هاي افقي از ستون اجل به مورت عمودي شروع به هرکت مي کنیم و هر پیکسل را با پیکسل قبل از هودش مقایسه مي کنیم اکر تقاوت آنها از عدد مشفصي بیشتر باشد آنجا لبه است . در غيراين صورت به آن كاري تدریم - یافتن لبه هاي عمودي هم به همین صبرت است منتها به صورت اققي شروع به حركت مي كنيم . > لبه هاي مورب ميشه كفت تركيبي 1( اين 2 لبه اند به اين صورت که جذر جمع مختصات هر پیکسل باید از عدي. مشخص بيشتر باشد در غير اين صورت لبه نيست . 18

صفحه 19:
مقدمه اي بر پردازش تصویر امطامات ** 0 بری نمايي2000 ) ) . ‏بزرک نمايي یا کوچک نمايي تصویر الکوریتم هاي مختلفي وججد دارد که ما به ساده ترین آنها اشاره مي کنیم‎ gly براي 2 برابر كردن تصوير بين هر سطر و ستون یک سطر و ستون اضافه قرار مي دهیم و مقدار آن ر۱ میانکین 2 پیکسل کناري آن. قراز مي دهیم . براي 1/2 كردن تصوير به صورت يكي در ميان سطر و ستون ها زا هذف مي كنيم .همين روش را براي ‎١‏ براير و ‎phe NT‏ کردن استفاده مي كنيم . 19

صفحه 20:
کاربردهاي بازشتاسي الکو در پردازش تصویر شناسابي الكو يكى ‎[١‏ شافه هاي موش مصنوعي است که با طبقه بندي (کلاسه بندي) و توصیف مشاهدات سروکار درد . شناسايي. الكو به ما كمك مي كند تا داده ها (الكوها) را با تكيه بر دانش قبلي يا اطلاعات آماري استفراج شده از الكوهاء طبقه بندي . الكوهايي كه مي بايست كلاسه بندي شوند. معمولا كروهي از سنمش ها یا امداف هستند که مجموعه نقاطي | در ففاي چند بعدي مناسب تعريف مي نمايند. ** كاربردهاي بازشناسي الكو بازشناسي الکو در بسياري از زمينه ها نقش كاربردي دارد . بازشناسي حروف. بازشناسي نويسنده. تصديق امضاء. طبقه بندي اثر .انكشت و بازشناسي كفتار نمونه هايي از اين کاربردها هستند. شناسايي الکو براي تعلیل داد ه هاي يزشكي نيز بكار كرفته شده است. 20

صفحه 21:
کاربردهاي بازشناسي الکو در پدازش تصویر ** کاربردهاي بازشناسي الکو براي مثال تفسیراکتروکارده‌کرام. تلیل تمنویر اشعه 6( و طبقه بندي کروموزم ها را مي توان تام برد. نمونه هاي ديكري از این کاربردها شامل طبقه بندي مناطق (راعي. مطالعه آلودکي آب ها. آشکار کردن منابع زيرزميني و پیش بيني آب و هواست. در اين نوع كاربردها . تصاویر ارسال شده از ماهواره و تصاویر هوايي به کمك روش هاي بازشناسي الکو تفسیر مي شوند. بازرسي تصویری و بازشناسي قطعات ماشيني. از کربردهاي منعتي شناسايي الکو هستند.تملیل بافت + آشکارسازي هدف در سیکنال هاي بركشتي رادار يا سونار . طبقه بندي امواج الزله و تشخيص ذرات شيميائي كاربردهاي ديكري از بازشناسي الكو مي باشند. 21

صفحه 22:
بازشناسي نوري حروف ( 0۴ ) متسه ** مقدمه اي بر پردازش متن افزایش روزافزون تولید اطلاعات که غالا به صورت مواد چاپي به بازار عرفه میگردد و فرورت دسترسي سریع و آسان به داده هاي موجود از يك سو. و حضور قراكير رايانه در عرصه هاي مختلف زندكي از سوي ديكر. متخصصان فتاوري اطاعات را بر آن داشته که همواره در بي يافتن راهكار مناسب براي كردآوري و يردازش اطلاعات به كمك رايانه باشتد. تبديل اطلاعات ‎(bo‏ ‏با مشخصه هاي متفاوت به مستندات متني استاندارد كامييوتري يكي از راهكارهاي اخزايش بازدهي خناوري اطاعات است. مزیت متن واقعي به ساير اشكال يك مستند بطور خلاصه عبارتند اه > متن, قابل ويرايش و جستجو است و به آساني مي توان آنرا يردازش كرد. امكان مستجوي عبارات در یک متن عجيم. امتياز بزركي ست > ههم متن معمولا بسيار كمتر از مجم تصویر مشابه است. >0 به متن ميتوان بسادكي توضيع. فرالينك, و امكانات رسانه مركب افزود. 22

صفحه 23:
بازشناسي نوري حروف ( 0۴ ) متسه OCR ( Optical Character Recognition) * منكامي كه يك سند متني اسکن مي شود. کامپیوتر ‎op)‏ متن را بصورت يك تصویر كرافيکي تشقیص میدهد. در نتيجه كاربران قادر نفواهند يود كه متن موجود در تصوير سند را ويرايش نمايند ويا آن را مورد جستجو قرار دهند. يك نرم اغزار +961 اين متن اسكن شده را فوانده و محتويات آنرا شناسايي نموده. و بصورت يك فايل در كامييوتر ذفيره مي سازد. هنين قابليتي امکان استفادة کسترده از کامپیوتر را در پردازش سریع مهم وسيمي از داده هاي مکتوب تولید شده توسط شرکتها و مؤسسات مختلف نظير بانكهاء شركتهاي بيمه. مناسسات خدمات عمومي. ادارة پست و سایر نهادهايي که سالیانه با میلیونها مورد پردافت, دریافت و مسابرسي امور مشتریان خود موامه اند. فراهم میآورد. کاربردهاي دیکر آن شامل تبدیل کتاب‌ها یا اسناد اسکن شده به فايل‌هاي متلي . مرتب گردن چک‌ها در بانک‌هاءخواندن آدرس بسته‌هاي پستي و مرتب کردن خودکار آدرس هاء کمک ب افراد نابیا با خواندن متون براي آنها. ارتباط بين انسان و ماشين با استفاده ازتحرير عادي دستي. و بسياري كاربردهاي ديكر ميشود. 23

صفحه 24:
بازشناسي نوري حروف ( 0۴ ) تاریفچه سیستم هاي 005 : ‏جنبه تاريفي. سيستمهاي +067 تا كنون مراهل تكاملي زيادي را يشت سر كذاشتهاند‎ (١ اولین اقدامات صورت گرفته در [ميتة بازشناسي حروف. در سالهاي اول دهه 1900 اتجام كرقته است كه داتشمتدان زوسي مي 24 قواستند به اراد مبتلا به تارسابيهاي بيتايي كمك نمايد. اولين اختراعهاي ثيتشده در اين [مينه مريوط به سال هاي 1929 و 1933 ميلادي مستند . اين سيستمها مروف جابي را با روش تطبيق قالب شناسايي ميكردند. به اين صورت كه ماسكهاي مكاتيكي مفتلقي |[ مقابل تصوير حرف عبور ميكردند و نور از يك سو به آن تابانده مي‌شد و از سبي دیکر توسط يك آشکارساز نوري دریافت مي‌گردید. وقتي يك انطباق کامل صورت مي‌گرفت. نور به آشکارساز نمي‌رسید و حرف ورودي بااشناسي ميشد . اين اختراع به دليل قناوري يانين مورد استفاده در آن. كاريردي نبود و با ظهور کامپيوترهاي ديجيتال به صورت يك ‎Bb Uy‏ ماند.

صفحه 25:
بازشناسي نوري حروف ( 0۴ ) ‎aye‏ اقدامات اولیه در زمینه 06 بر متون چاپي یا مجموعه کوچکي 1[ مروف و تمادهاي دستتویس که برامتي قابل تشفیص بودند متمرکز کردیده بود که عمدتً از روش تطبیق قالب استفاده مي‌نمودند به این صورت که در آن تصویر ورودي با مجموعه بزركي از تصاوير حروف مورد مقايسه قرار مي‌گرفت . در این دوره. ت ات موفق اما معدود شده (منظور از معدود شده. مفروض دانستن شرايط و فرض هاي خاص براي كاراكترهاي ورودي است). بیشتر بر روي مروف و اعداد لاتين انجام. گرفت. با این مال مطالعات چندي نیز بر روي مروف ژآپني. چيني. عبري. هندي. سيريليكي. يوناني 9 عربي در هر دو زمينه عروف چاپي + دستنویس آغاز کردید . مطالعات صورت گرفته تا قبل از سال 1980 بدلیل خقدان سفت‌اغزارهاي قدرتمند و دستگاه‌هاي ورودي مناسب با مشکل همراه بودند. اما از دهه 1980 به بعد بواسطه رشد انفجاركونه ختاوري اطلاعات. وضعيت بسيار مناسبي براي تمقیقات مختلف از جملءبازشتاس مروف فراهم کردید. 25

صفحه 26:
بازشناسي نوري حروف ( 0۴ ) ‎aye‏ در اين مقطع زماني بود كه با تكوين آبزرها وت 26 ‎gla‏ پردازشي جدید. پیشرفت واقمي در سيستم‌هاي 068 محقق کردید. در ‏اوايل دهه 60 روش‌هاي پردازش تویر و بزشناسي الکو با تكنيكهاي كارآمد هوش مصنوعي ادغام كشتند. محققان. ‏لكوريتم‌هاي پيچيه‌اي رد بازشناسي مروف ابداع نمودند که قادر يودند دادههاي ورودي با تفكي كيذيري بالا را دريافت ‏کنند و در مرمله يياددسازي. محاسبات بسيار زيادي را بر روي داددها انجام دهند. امروزه علاوه بر وجود رايان هاي قدرتمندتر و ‎ ‏تجهيزات الكترونيكي دقيقتر مانند اسكنرها. دوربينها و صفمات رقميكننده. استفاده از تكنيكهاي بردازشي مدرن و ‏توانمند همچون شبكه‌هاي عمبي . مدلهاي ماركوف ينهان . منطق فازي. و مدلهاي يردازش زبان طبيعي امكانيذير ‎ ‎

صفحه 27:
بازشناسي نوري هروف ( 00۴ ) بررسي اجزا و اماع سیستم 0015 ‎ *‏ دريك تقسیم بندي كلي میتوان سيستمهاي 0618 را از لحاظ نوع الكوي ورودي به دو كروه تقسيم كرد ‏> سيستمهاي بازشناسي متون جابي. > سيستمهاي بازشناس متون «ستنویس همچنین از جنبه نموه ورود اطاعات. سيستمهاي 065 به دو دستة زیر تقسیم بندي مي شوند : ‏> سیستمهاي يرقم ‏+ سيستمهاي برون قط ‎27 ‎

صفحه 28:
OCR ena costo el gone ) 0۴ ( ‏بازشناسي نوري حروف‎ 28 در بازشناسي پرقط: مروف در همان زمان نکارش توسط سیستم تشفیص داده میشوند. دستگاه ورودي این سیستمها يك قلم نوري است. در اين روش علاوه بر اطلاعات مربوط به موقعيت قلم. اطلاعات زماني مربوط به مسير قلم نيز در اختيار است. اين أطلاعات معمو” لا توسطا يك صفحة رقومي كننده اخذ مي شوند. در این روش مي توان از اطلاعات زماني سرعت. شتاب. خشار و زمان برداشتن و کذاشتن قلم روي صفعه در بازشناسي استفاده کرد در بازشناسي برون خط. از تصویر دو بعدي متن ورودي استفاده مي شود. در اين روش به هيح نوع وسیله نکارش خاصي نیاز نیست و تفسیر داد ه ها مستقل از فرآیند تولید آنهاتنها راساس تصویر متن صورت مي كيرد. اين روش به نموة. بازشتاس توسط انسان شباهت بيشتري دارد.

صفحه 29:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 بخشهاي مختلف يك سيستم +001 كامل. پردازش : شامل کلية اعمالي که روي سیکنال تصويري خام صورت ميكيرند تا موجب تسهیل روند امراي خازهاي بعدي کردند منندباينري کردن تصویر, هذف نويز. هموارسازي. نازك سازي. زبان و فونت كلمات و اتظاير ايتهاء ارت است از روش هايي كه بقش هاي مفتلقي همهون ياراكراف هاء جملات يا كلمات. و حروف (ا از تصویر سند استفراع مي نمایند. ج- استخراج ويزكي ها : مجموعة كلية محاسباتي است كه زوي الكوهاي بدست آمده از مرملة پردازش انجام ميشهد تا برداز ويكي هاي متناظر با هر الكو تعيين كردد. 29

صفحه 30:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 « بازشناسي با يك یا چند طبقه بندي کننده + شامل روش هايي براي متناظر ساختن هر يك از اكوهاي بدست آمده از مرملة استفراج ويژگي ها با يكي از كلاس هاي فضاي الكوهاي مورد یمث است که از طریق کمینه سافتن فاصلة بزدار ويزكي هاي هر الكو نسبت به يكي |[ بردارهاي مرمع موجود در يايكاه داده هاي سيستم اتجام مي كيرد. ه - بكارگيري اطلاعات جانبي (پس پردازش) : مانندمجموعه نقات معتیلٍ اطاعات ماري روط به رفداد موه الاعات ‎pola gals‏ [sore [swat | ferme of ete | ‏سب‎ : 30

صفحه 31:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 سيستم هاي 0618 فارسي مسئلة بازشناسي حروف الفباي خارسي سابقهاي نه چندان طولاني به همراه دارد. نفستين كزارشهاي رسمي منتشر شده از لاشهاي انجام گرفته در اين رادء مربوط به ساليان نخست دهق ۱۹۸۰ ميلادي است به رغم فا کاریرد الفباي فارسي در ‎a §‏ ي فارسي. ميان ملل مختلف قارة آسياء بررسيهاي انجام شده در خصوص يافتن زوشهايي براي بازشتاسي حروف اين الفبا بسيار محدود بوده است. بواسطة وجود تفاوتهاي اساسي بين نحوة نكارش كلمات فارسي و كلمات لاتين نظير مسبيده بودن مروف سازندة يك کلمه به یکدیکر و تفییر شکل هروف بر اساس موقعیت نسبي قراركيري آن در يك کلمة قارسي. امکان اعمال مستقيم روشهاي متداول در بازشناسي حروف انكليسي بنظور شناسايي مروف تشکیل دهندة کلمات فارسي وجود ندرد. 31

صفحه 32:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 در هال هاضر يكى ا[ نرم اغزار تجاري كارآمد +01 كه زبان فارسي را ‎vane Automatic Reader ss go (sity‏ شركت عربي #تطعلة5 است كه داراي 2 نفسه 6014 و تسناصة8 1 ميباشد . در حال حاضر قيمت نسفه 07 آن 4000 ۰ دار است .این رقم در مقايسه با قيمت نرم اخزار هاي معروفي همهون 015506 كه مداکثر 600 دار مي باشد اما قابل ملامظه میباشد . شرکت "جیمونافزر" یک نرم زار 065 فارسي بنام تشناسا" (506۳۸6۸) داشت که قیمت آن در سال 1۹۹۷ مدود 39 ما از كاريي چندان مجرد قيليبرفوردرتبودچون متاسفانهماصل قارسي ‎(gla cbs gala gil‏ قبلي و فعلي محصولات عفر هستند که در مواردي تنهابه خارسي سازي منوها اکتفا شده است. نرم اخزار ديكرى به نام ‎Pro 11 Middle East‏ عقعز116۵ به تزکی منتشر شده که ‎obj‏ فارسی را هم پشتیبانی مي ais 32

صفحه 33:
OCR ena costo el gone ) 0۴ ( ‏بازشناسي نوري حروف‎ در نسفه هاي پیشین این نرم اغزارزبان خارسي وجود نداشت و تنها با استفاده از امکان عربي آن ميشد پردازش ناقصي انجام داد این نرم افزر یا قیمت 300000 دار ه فروش رسید ۱ به دلايل كفته شده 018 درمرملة كنوني در كشور ما مربوط به «دستنويس هاي كسسته» يا متنهاي تايپي پیوسته است. و 5 بازشناسي متن‌هاي دست‌نویس پیوسته توسط كامبيوتر راه زيادي در بيش است. هون در دست نويس ماي كسسته. اكرجه هزوف به هم شبامت دارند. حداقل جداجدا نوشته شدهاند. در متنهاي بيوسته تايبي هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم. البته به كفته مسئولان شركت «يايا» در مال حاضر هم نرمافزارهايي وجود دارد كه متن دست نويس بيوسته را تبديل ب مروف جدا ازهم و كسسته ميكنند. ولي ضريب خطاي اين نرماخزارها زياد است و به شكل صنعتي درنيامدمائد. Omni Page Pro 12 - ABBYY FineReader - Text Bridge : ‏نرم افزار های دیکر‎ 33

صفحه 34:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 ** مشكلات و بيجيدكي هاي يد روي 061 هاي فارسي و عربي نگارش فارسي. ويژگي‌هاي منمصر به فردي دارد که آن را کاملاً از نگارش لاتین متمایز مي‌سازد. به منظور فعالیت در موزه 068 فارسي. آكاهي از قوانين نكارشي و نموه چاپ مروف در ین زبن.امري ضروري است > در کلمات فارسي برفي از هروف از يك یا دو طرف به روف مجاور خود اتصال دارند و برفي نیز به صورت مجلا نوشته مي شوند. در نتيجه هر کلمه ممکن است شامل يك یا پند بفش متصل باشد که «زیرکلمه» نامیده مي‌شوند. چ سرهم بودن حروف در نكارش فارسي. بازشناسي متون فارسي را براي سيستم‌هاي 068: نسبت به متون لاتين بسيار مشكلتر موسااد. >2 هروق غارس ممکن است چهار مجقعیت مجلا ود تتيجه جهار شكل متفاوت نكارش داشته باشتد: حروف ابتدابي. مياتي. ایا هدود 100 شکل مفتلف هرف و عدد در مجموعه تشقيص وجود قواهند داشت. انتهايي و مجزء 34

صفحه 35:
بازشناسي نوري حروف ( 00:15 ) بررسي اجا و انواع سیستم 0018 > هزوف واقع دريك كلمه ممكن است هميوشاني داشته باشند. بدين معنا كه نتوان با رسم خطوط عمودي. حروف را به طور كامل از يكديكر مجزا نمود. > متون فارسي برخلاف متون لاتين از راست به جب نوشته مي‌شوند. > در برقي ازفونتها بعضي ا[ حروف. ازيك سمت در دو ممل به يكديكر اتصال دارتد. >0 پرفي از مروف بین يك تا سم نقطه دارند كه ممكن است در بالا يا بايين بدنه حرف واقع باشند. >0 بعضي از مروف بدنه مشابه ارند و تفاوت آن‌ها تنها در تعداد و محل قراركيري نقاط يا در وجود يك سركش است (مانند «ك» و «كه) كه در مقايسه با بدنه حروفء انحازه بسيار كووكي دارند. اين موضوع نيز يكي ‎Hl‏ مواردي است كه بر بيجيدكي سيستم‌هاي 0618 فارسي مي‌افزاید. ~ مروفي که از طرف چپ قابليت اتصال به حرف مجاور فود را دارند. ممكن است به صورت كشيده نوشته شوند. 35

صفحه 36:
OCR ena costo el gone ) 0۴ ( ‏بازشناسي نوري حروف‎ 36 حروف قارسي ممكن است در بالا يا يايين بدنه داراي اعراب باشند. سم اعراب 2 - در زان فارسي, آعراب‌هاي اصلي‌اند و اعراب برفي كلمات عربي رايج در زبان فارسي دیده مي‌شود (نظیر کلمات «عمداه و «امتمللً). کلمات عربي داراي اعراب و - در زبان فارسي عمومیت نیافته‌ند. هر چند کاربرد اعراب در زبان فارسي نسبت به زبان عربي بسیار مهدودتر است. اما اكر كلههاي تامتداول باشد يا به دليل تشابه نكارشي آن با کلمه ديكر. تأکید بر تلفظ صمي آن باشد. 1[ نشانههاي اعراب استفاده مي شود. ضمنا در بالاي بدنه يك حرف ممكن است علامت تشديد وجود داشته باشد و برقي از هروف داري علامت همزه مستند. دربارة اعداد فارسي هم اين مشكل وجود دارد: صفر ما تنها يك نقطه کوپك است که مي‌تواند سیستم ( به اشتباه بیندازد: اعداد 4 3. 2 1 هم بسیار به هم شبیه هستند و تنها تفامتشان در دندانه ها است. در متون دستنويس فارسي. تلوع تحرير بسيار زياد أست. الواع شکلها براي مروفي مانلد س . ي . ها غیره متصور است. در تمریر دستنویس ا[ سبي دیکر مشفصه هاي مرکت قلم نیز قابل تملیل هستند.

صفحه 37:
بازشناسي نوري حروف ( 00۴ ) بررسي اجا و انوا سیستم 061۴ > بیشتر مروف فارسي (مصوصاً مروف چسبیده) دندنه‌دار هستند. در مواردي که کیفیت سند اصلي یا دستگاه اسکنرپایین باشد. ارتفاع دنداتهها نسبت به خط [مینه كوتاه مي شود و اين امر. شناسايي صحیع این هروف در مرمله قطعه‌بندي یا بازشناسي را با مشکل مواجه مي‌سازد. خورشید ع عع ع حکم 5 ur he us ur ue ۰ او 37

صفحه 38:
بازشناسی نوري هروف ( 05 ) تملیل بفشهاي مختلف سیستمهاي 061 001۴ ‏تملیل بخشهاي مختلف سيستمهاي‎ * diy این مرمله شامل کلية پردازشهايي است که بر روي سیکنال هاي تصويري فام انجام مي شوند تا موجب تسهيل يا افزايش دقت روتد اجراي فازهاي بعدي کردند. از مجموعة این پردازشها هدفهاي زير دنبال مي شود + Shp ‏کاهش‎ -١ نرملیزه نمودن داد ها ۳- فشرده سازي میزان اطلاعاتي که مي بایست معفوظ بماند. ‎g‏ اتي كه مي 38

صفحه 39:
بازشناسی نوري هروف ( 05 ) تملیل بفشهاي مختلف سیستمهاي 061 ** کاهش نویز نويز ايجاد شده بواسطة دستكاه هاي اسكتر نوري يا ابزارهاي نكارشي منجر به ايجاد قطعه خم هاي كسسته. اتصال بين خطوط. فضاهاي قالي در خطوط متن. ير شدن حفره هاي موجود در تصوير برفي حروف و غيره مي كردد. همهنين اعوجاج هاي مفتلف شامل تغييرات محلي. منمني شدن كوشه هاي حروف. تغيير شكل و يا فوردكي مروف را نيز بايستي مد نظر قرار داد. قبل از مرملة بازشناسي هروف لازم است که اين نقايص برطرف شوند. تكنيك هاي مختلف کاهش نویز (۱ مي توان به سه کروه اصلي دسته بني نمود : الف- فيلتر كردن ب- عملگرهاي مورفولوژی ۵ مدلسااي نویز 39

صفحه 40:
بازشناسي نوري حروف ( 005 ) ‎gatas ds‏ مختلف سيستمياي061 تت ——— ** کاهش نویز Information information Information

صفحه 41:
بازشناسی نوري هروف ( 05 ) تملیل بفشهاي مختلف سیستمهاي 061 ** 0 ترمالیزه کردن داده ها روش هاي نرماليزه كردن داده ها به مذف تغییرات نكارشي كمك نموده. داده هاي استاندردشده اي تتیمه مي دهد روش هاي پاية نرمالیزه کردن عبارتند از: الف - ترماليزه كردن كمِي متن و استفراج قطوط [میته ب- ترماليزه كردن اريب شدكي ج- ترماليزه كردن (تغبير مقياس دادن) اتدازة. د- هموارسازي كانتور هر كدام از اين مباحث به تلهايي قابل بحث و شرع مي باشند كه ما دز اين بحث به خلاصه اي از هر كدام از اين مهارد مي پردازیم 41

صفحه 42:
بازشناسي نوري حروف ( 0015 ) تمليل بخشياي مختلف ‎OCR essays‏ الف - ترماليزه كردن كجِي متن و استفراج فطوط [مینه بدیل عدم دقت در مرملة اسكن و يا بي دقتي نويسنده در هنگام نکارش متن دستنویس, ممکن است فطوط متن نسبت به تصوير 42 اندكي انحراف يا هرفش داشته باشتد . اين مسئله مي تواند كارايي الكوريتم هاي بكار رفته در طبقات بعدي سیستم 6 را تأثير قرار دهد. هرا كه يكي اذ مفروضات بيشتر روشهاي قطعه بندي. عدم كج بودن تصوير متن ورودي است ودر نتيجه لازم است كه اين نقيصه آشكار و تصميح كردد. آشكارسازي خط زمينه در بسياري از تكنيكهاي قطعه بندي و بازشناسي متون فارسي. عربي و لاتين نقش اساسي دارد. علاوه بر اين. برخي از كاراكترها را ميتوان بواسطة موقعيت تسبيشان نسبت به خط زمينه آشكار ساخت.

صفحه 43:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 ‎ *‏ روش هاي بکار رفته جهت تصمیح كجي خطوط زمینه در متون لاتین عبارتند از ء ‏|- بكارگيري هیستوگرام ) پروفایل تصويرنمايي ) تصویر ‎=P‏ استفاده از روش فوشه بندي نزدیکترین همسایه ها ۳- روش هميستگي متقابل بین مروف ‏عا- تبديل هاف ‎ ‏یا کر ات زج - ‎ere fe‏ مه ار سیر ‎ ‎43 ‎

صفحه 44:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 ب- نرماليزه كردن ازيب شدكي. در متون چاپي خارسي و این . كاراكترهاي داي فرمت ایتالیك از راستاي عمود انعراف دارند. همچنین در متون دستنویس برفي از نویسنده ها مروف را پسورت زاویه دار مي نویسند. این شنافته مي شود و مي تواند دقت برفي از الكوريتم هاي قطعه بندي « أريب شدكي » يديده تحت عنوان یا بازشناسي را تمت تأثیرقرار دهد و لذا در أين سيستم ها لازم است كه در مرهلة بيش بردازش ‎٠‏ ميزان اريب بودن كاراكترها شناسايي و تصهیح گردد. ارييشدگي بصورت زاوية شیب بین طویل ترین زیرمرف در يك کلمه و جهت عمودي تعریف مي شود. نرمالیزه کردن اریب. بنظور ترمالیزه تمودن كلية كاراكترها به يك قرم استاندارد بکار مي رود. معمول ترین روش در تقمین میزآن اریب شدگي, محاسبة زاوية متوسط اجزاء نزديك به خط عمود است . استفراج فطوط عمودي از كاراكترها بوسيلة يك جفت فيلتر يك بعدي انجاه مي يذيرد. مختصات شروع و يايان هر خم زاوية اريب را بدست مي دهد. 44

صفحه 45:
بازشناسي نوري حروف ( 0015 ) تمليل بخشياي مختلف ‎OCR essays‏ م- ترمالیزه کردن (تغییر مقیاس دادن) اندازه در سيستم هاي +061 اغلب تصاوير كنمات خيلي كوهك یا فيلي يزرك. به يك اندازة استاندارد نرماليزه مي شوند. اين عمل معمو لا با نمونه برداري مجدد ‎٠‏ تصوير انجام ميكيرد. روش هابي نظير 8/1063 يا أداناءأ8 بر روي تصاوير سطع خاکستري بنمو مناسبي عمل ‎aise‏ اما عمليات نمونه برداري موجود در آنها . كاراكترهاي دوسطمي را دهار اعوجاج مي سازتد. يك راهكار استاندارد . اعمال يك زوال دو مرمله اي است که در آن ابتدا كانتور هموار اصلي مربوط به كاراكتر نمونه برداري. شده. توسط يك فينتر كانولوشن وزندار 1 و كوانتيزاسيون دوسطمي دامنه 7 تقريب زده مي شود و يس 1[ آن عمل نموله. برداري مجدد انجام مي كيرد . روش هلي بازشناسي حروف ممكن است نرماليزه كردن اندازه را در هر دو مهت أفقي و عمودي انجام دهتد. در هر كاراكتر به تعدادي ناميه تقسيم ميشود و هر يك أ[ اين نوامي ‎٠‏ بصورت جداكانه تغبير مقياس داده مي شوند. 5

صفحه 46:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 د- هموارسازي کاتتور در متون دستنویس. يواسطة لرزش یا مرکات تاقواستة دست نویسنده هنگام تکارش, ممکن است که کانتور مروف شکل ناصاف. پیدا کند. عمچنین این مسلله میتواند در سيستمهاي بازشناسي متون چاپي و دستلدیس بدلیل تغییر مقیاس مروف ويا وجود نويز در مرملة اسكن تصاوير نيز ظاهر كردد. روشهاي هموارسازي كانتور بمنظور جبران اين نقيصه مورد استفاده قرار ميكيرند. بطور كلي هموارسازي كانتور تعداد نقاط نمونة مورد نياز براي بازنمايي كاراكتر را كاهش ميدهد و در نیمه کارا مرامل پردازشي باقیمانده را بهیود مي بخشد. در مقدار هر ييكسل از تصوير متن با مقدار ميانكين وزني بيكسل هاي همساية آن جايكزين ميشود كه با دو بار تكرار اين عمل. تصوير هموارتري از متن دستنويس بدست ميآيد و در نتيجه اثر لرزش دست نویسنده کاهش پیدا میکند.. 46

صفحه 47:
بازشناسي نوري حروف ( 05 ) تمليل بفشياي مختلف سیستمهاي0018) ** فشرده سازي اين مسئله يذيرفته شده است كه تكنيكهاي كلاسيك خشرده سازي تصامير كه تصوير زا أزهوزة مكانيبه موز هاي دیکر منتقل مي کنند با بااشناسي مروف مناسب نمي باشئد. در باأشناسي حروف. عمل فشرده سازي نيازمند آن دسته از تکنيك هاي موزة مكاني است که اطاعات شكلي را حفظ مي نمايند. دو تكنيك متعارف فشرده سازي. يكي تكنيك اعمال سطع آستانه بمنظور باينري كردن تصاوير سطع فا" متون د ديكري ناك سازي مي باشد . الفد- باينري (دوسطمي) كردن تصوير مقن + بمنظور كاهش مجم ذفيره ساي مورد نيازو افزايش سرعت يردازش. اغلب مطلوب است 5 با انتفاب يك سطع آستانه, تصاوير سطع فاكستري يا رنكي را به تصاوير باينري تبديل نمود. 4

صفحه 48:
بازشناسی نوري هروف ( 05 ) تملیل بفشهاي مختلف سیستمهاي 061 ب- نازك سازي این عمل درهالیکه کاهش قابل ملامظه اي در حجم داده ها ايجاد ميكند. اطلاعات شكلي كاراكتر را نيز استخراج مي نماید. دو رش ‎aly‏ براي نازكسازي عبارتند از « نازكسازي از طریق پیکسل ۰,۰ نازكسازي غیر از طریق پیکسل ۰ . نازكسازي از طريق بيكسل بصورت مملي و تكراري تصويز را مورد پدازش قرار مي دهد تا مقتي که ‎[١‏ تصوير كاراكتر تنها اسكلت آن. به عرض يك پیکسل باقي بماند. این روش نسبت به نويز بسيار حساس بوده. ممكن است تصوير كاراكتر را مخدوش سااد. از سوي ديكر . روش هاي نازك سازي غير از طریق پیکسل . طي فرايند نك سازي مقداري از اطلاعات سراسري دربارة كاراكتر را مورد استفاده قرار مي دهند. 48

صفحه 49:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 ب- نازك سازي ‎Cc, 6‏ = سرام رار يج = 5 = =

صفحه 50:
بازشناسي نوري حروف ( 00:15 ) تمليل بخشياي مختلف سيستمهاي :01 * قطعه بندي ‎Alay‏ پیش پردازش يك تصویر اصلام شده از ستد ر! تتیجه مي دهد بکونه اي که مقدار کاقي از اطلاعات شکني. فشرده سازي بالاو نویز نویز پایین. از تصویر نرمالیزه شدة سند قابل حصول يك مرملة بسيار با اهميت در بازشناسي حروف مخصوصًا حروف. ‏است. قطعه بندي قارسي و عربي كه بصورت بيوسته توشته مي شوند مي باشد , هرا كه نتيجة بدست آمده از جداسازي ‎ ‏كلمات , قطوط یا کاراکترها ابر روي نرق بازشتاسي سيستم تأثير مي كذارد. ‏.قطعه بندي غلط كاراكترها . عامل بسياري از فطاهاي 01 است ميزان دقت يك الكوريتم قطعه بندي به سبك نكارش مروف , ‏كيفيت دستكاه يرينت و نيز نسبت اندازة فونت به رزولوشن دستكاه اسكئر يستكي دارد م دو نوع قطعه پندي وجود داد ء ‏الف) قطعه بندي بيروتي ب) قطعه بندي دروتي. ‎50 ‎

صفحه 51:
بازشناسي نوري حروف ( 0015 ) تمليل بخشياي مختلف ‎OCR essays‏ الف - قطعه بندي بيروني : قطعه بندي بيروني که عبارت است از مداسازي بخش هاي مختلف نکارش مانند پاراگراف ها : جملات یا کلمات اين مرمله بحراني ترين و مساس ترين قسمت در زمينة آثاليز اسناد ميباشد و يك مرملة ضروري براي سیستم هاي بازشناسي. حروف برونخط محسوب ميشود. كر جه مبحث آاليز اسناد با روش ها و تكنيك هاي خاص فود يك حوزة تحقيقاتي تا هدي متفاوت نسبت به 068 است , ليكن تقسيم بندي تصوير سند به نوامي متني و غير متني. يك بفش لاينفك نرماغزارهاي ‎OCR‏ به مساب میآید. 8 | يبا ‎LJ] ‎ ‎ ‎ ‎ ‎51 ‎[bo ‎ ‎ ‎ ‎ ‎

صفحه 52:
بازشناسی نوري هروف ( 05 ) تملیل بفشهاي مختلف سیستمهاي 061 ب - قطعه بندي دروني : قطعه بندي دروني که متظو از آن ۰ جداسازي هروف کلمات مخصوصًا در مورد كلمات سر هم توشته شده در متون لاتين و يا رسمالخطا هاي ييوسته نظير فارسي و عربي است . عليرغم فعاليت هاي مشمكير دهة كذشته و تنوع تكنيك هاي معرقي شده . قطعه بندي متون بيوسته ( بخصوص متون دستنويس بيوسته ) به حروف منوز هم بصورت يك مسئله باقي مانده است. روشه اي قطعه بندي مروف به سه دسته تقسیم مي شوند: الف- قطعه بلدي مریم ب- قطعه بندي ضمني ج) تكنيك هاي أدغام شده 52

صفحه 53:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 الف- قطعه بندي صریم در اين روش قطعات بر ميناي غاصیت هرفسان بودنشان (شبامت داشتن به يك مرف) . تشفیص داده مي شوند.فرآیند قطعه .بندي تصجير به اجزاء بامعني يك نام خاص دارد : تشريع . تریح فرايتدي است كه يك تصوير را بدون بكاركيري يك كلاس بخصوص |[ اطلاعات شكلي تحليل میتماید. معیار ستمش قوب بودن قطعه بندي. هم فوان بودن خواص عمومي قطعات با قصوصيات مورد انتظار براي كاراكترهاي معتبر است. تكنيكهاي موجود مبتني بر تشريع يك تصویر عباتند > استفاده از خضاهاي غالي و نقاطاوم. آنالیز تصويرنمايي عمودي. آثاليز اجزا» ‎Gok‏ بكاركيري قراین زبانشافتي, قطعه بندي صریح را در معرض ارزشيابي قرار داد 53

صفحه 54:
بازشناسي نوري حروف ( 05 ) تمليل بخشياي ‎atthe‏ سیستمیاي 0610 ب- قطعه بندي قمتي این روش قطعه بندي بر پاية بازشناسي است و تصوير سند را براي يافتن اجزايي كه با كلاس هاي از قبل تعريف شدهاي مطابقت. داشته باشند. مورد جستجو قرار ميدهد. قطعه بندي. بر مبناي ميزان صحت نحوي يا معنايي نتايج كلي حاصله از بازيابي انجام مي كيرد. در اين رويكرد. دو ( كروه از روش ها قابل بكاگيري مي باشند) روش هايي که چندین روال جستجه را انمام مي دهند و روش هايي که بردارويژگي تصویر ر۱ قعطعه بندي مینمایند. كلاس نخست سعي در قطعه بندي كلمات به حروف يا ساير اجزاء بدون استفاده از الكوريتم هاي ربع مبتني برويزكي دارد به عبارت دقيقتر. در اين روش بدون در نظر كرفتن محتوا. تصوير بطور اصولي به قسمتهاي همپوشان تقسیم مي شود. از دیدکاه مفیومي. این دسته روش ها از تكنيك هايي که براي بازشناسي کلمات ‎gale‏ توسعه داده شده اند. نشأت مي گیرند. 54

صفحه 55:
بازشناسي نوري حروف ( 0015 ) تمليل بخشياي مختلف ‎OCR essays‏ ب- قطعه بندي ضمتي ( ادامه .. ). كلاس دوم از زوش هاي قطعه بندي ضمني. تصوير را با كلاسه بندي زيرمجموعه هابي ‎(١‏ ويأكي هاي مكاني (استفراع شده از كل تصوير) بطور ضمني قطعه بتدي مي نمايد. اين فانواده از روش هاي مبتني بر بازشناسي. از تكنيك هاي ملايم سازي احتمالاتي. مفهوم نقاط منتظم و نقاط تكين. و تطابق بازكشتي استفاده مي نمايند. ج - تكنيكهاي ادغام شده اين تكنيك هاء روش هاي قطعه بندي صريح و ضمني را در هم ميآميزتد. يك الكوريتم تشريع با هدف قطعه بندي أضافي به تصوير اعمال مي شود . بدين معني كه تصوير آنقدر به نواهي مفتلف برش داده مي شود تا اطمينان حاصل كردد كه مرزهاي قطعه بندي صميح نيز در ميان قطعات ايجاد شده موجود مي باشتد. يس ‎[١‏ حصول اطميتان. قطعات ايجاد شده توسط تكنيك هاي كلاسه بندي مورد ارزيابي قرار مي كيرند تا از ميان آنها قطعه بندي بهيته استخراج كردد. 55

1 به نام خدا ‏ عنوان پروژه :تحقيق و بررسي کاربرد هاي پردازش تصوير ‏ واحد درسي :درس گرافيک کامپيوتري ‏ استاد مشاور :جناب آقاي دکتر درخشان ‏ استاد راهنما :جناب آقاي دکتر درخشان ‏ تهيه کنندگان :حسن جباري 83912515661 امين ثابت قدم اصل 2 83912515760 اهداف مقدمهايبرپردازشتصويروتعريفاصطالحات معرفيچندکاربردازپردازشتصوير پردازشمتن ( ) ORC 3 مقدمه اي بر پردازش تصوير ‏ مقدمه مقدمه اي بر پردازش تصوير در هر سيستمي و با هر عملکردي براي تصميم گيري به داده هاي ورودي احتياج داريم .اين ورودي ها ميتوانند از يک سنسور صوتي, سنسور فاصله سنج ,سنسور مادون قرمز ,ميکروفن و با تصاوير ارسالي از يه دوربين باشد. امروزه پردازش تصوير بهترين ابزار براي استخراج ويژگي ها و تحليل موقعيت و در نهايت تصميم گيري صحيح مي باشد .در مورد انسان نيز به همين صورت است ,اطالعات از طريق چشم به مغز ارسال مي شوند و مغز با پردازش اين اطالعات تصميم نهايي را گرفته و فرمان را صادر مي کند. هدف از پردازش تصوير پياده سازي عملکرد ذهن انسان در قبال داده ها و انجام پردازش هاي خاصي براي استخراج ويژگي مورد نياز براي رسيدن به هدف از پيش تعيين شده مي باشد. 4 مقدمه اي بر پردازش تصوير اصطالحات - 1چند تعريف پيکسل کوچکترين جزء PIXELاست .پيکسل مخفف Picture Elementبه معني المان تصوير است .يک تصوير متشکل از تعداد زيادي پيکسل است که در کنار هم قرار گرفته اند .در واقع زماني که با يک دوربين ديجيتال عکس مي گيريد اگر رزولوشن دوربين شما 640480xباشد به اين معني است که ماتريس با ابعاد 640480xدر اختيار شماست که 640پيکسل در طول و 480پيکسل در عرض دارد .به ازاي هر پيکسل يک سلول نوري در دوربين وجود دارد .شدت نور اين سلول نوري مقدار عددي را براي اين پيکسل تعيين مي کند .به طور مثال به ازاي رنگ سياه مقدار صفر در پيکسل ذخيره مي شود و به ازاي رنگ سفيد مقدار 255در آن ذخيره مي شود. 5 مقدمه اي بر پردازش تصوير ‏ اصطالحات همسايگي : 2نوع همسايگي وجود دارد ‏ همسايگي 8تايي به صورت : (, ) i - 1 , j ( , ) i + 1 , j - 1 ( , )i , j - 1 ( , )i - 1 , -1 ( )i + 1 , j + 1 ( , ) i , j + 1 ( , )i - 1 , j + 1 ( , ) i + 1 , j ‏ همسايکي 4تايي به صورت : () i , j + 1 ( , ) i , j - 1 ( , ) i + 1 , j ( , ) i - 1 , j ‏ زمينه به مجموعه پيکسل هايي که شامل آبجکت نيستند ,يا مجموعه پيکسل هايي که شامل ’Sهستند گفته مي شود . ( ’Sپيکسل هايي که شامل آبجکت نمي باشند ) 6 مقدمه اي بر پردازش تصوير ‏ اصطالحات مسير ) ) path 2پيکسل را در يک تصوير باينري در نظر بگيريد . اگر راهي بين اين 2پيکسل از طريق پيکسل هايي که حاوي آبجکت هسنتد وجود داشته باشد ,به پيکسل- هاي مرتبط مسير گفته ميشود . ‏ اتصال اگر Sمجموع پي کسل هايي باشد که شامل آبجکت هستند پس ’Sشامل ييکسل هاي بک گراند است 2 .پيکسل pو qکه هر 2 متعلق به Sهستند متصل به يکديگرند اگر حداقل يک مسير بين pو qوجود داشته باشد . 7 مقدمه اي بر پردازش تصوير ‏ مرز تصوير ( ) Border کليه پيکسل هايي که در اطراف آبجکت قرار گرفته اند . ‏ حفره مجموعه اي از ’Sکه حتي يک پيکسل هم در Borderنداشته باشد ,حفره ناميده مي شود . 8 اصطالحات مقدمه اي بر پردازش تصوير ‏ اصطالحات هيستوگرام هيستوگرام در واقع همان نمودار ميله اي افزوني هر رنگ مي باشد ,به عنوان مثال تعداد پيکسل هايي که حاوي رنگ شماره 75هستند 25عدد است .از هسيتوگرام براي آستانه گيري استفاده مي شود. ‏ آستانه گيري ( ) Threshold فرض کنيد مي خواهيد از يک عکس 16بيتي يک تصوير سياه و سفيد بسازيد .براي اين کار بايد تک تک پيکسل ها را با مقدار مشخصي مقايسه کني د اگر بزرگتر از آن مقدار مشخص بود به جاي آن رنگ سفي د و اگر کوچکتر بود به جاي آن مقدار سياه قرار مي دهيم .به اين کار آستانه گيري با Thresholdمي گويند . 9 مقدمه اي بر پردازش تصوير ‏ اصطالحات محاسبه مساحت و محيط : فرض کنيد که تصويري از دايره در يک زمينه سفيد رنگ داريد مانند شکل روبرو : براي بدست آوردن مساحت اين دايره فقط کافي است که تعداد پيکسل هايي که مقدار عددي آن صفر است را بشماريد و آن را کاليبره کنيد ( به اين معني که با توجه به فاصله دوربين تا آبجکت ,نسبتي بين تعداد پيکسل هاي واقعي آبجکت و تعداد پيکسل هاي تصوير بدست آورد ) .به اين ترتي ب به راحتي مي توان مساحت هر آبجکتي را بدست آورد حتي اگر منظم نباشد . براي بدست آوردن محيط دايره مي توان ابتدا شعاع داي ره را با استفاده از مساحت آن به دست آورد ( ) R = S / IIسپس با استفاده از فرمول P = 2 IIRمحيط را محاسبه کرد . 10 مقدمه اي بر پردازش تصوير ‏ اصطالحات نحوه بدست آوردن مرکز تصوير و آبجکت : ‏ براي بدست آوردن مرکز تصوير از روش زير استفاده مي شود : به اين معني که تعداد پيکسل هاي ماتريس در سطر و تعداد پيکسل هاي ماتريس در ستون تقسيم بر 2دقيقا i , jپيکسل مرکز تصوير خواهد بود . ‏ براي بدست آوردن مرکز آبجکت بايد به صورت زير عمل کرد : مساحت آبجکت را بدست مي آوري م .براي به دست آوردن مساحت تعداد پيکسل هاي آبجکت را جمع ميکنيم .حال براي بدست آوردن Iمرکز آبجکت مقدار jها را با هم جمع مکنيم .حال براي بدست آوردن jمرکز آبجکت مقدار iهاي پيکسل ها را با هم جمع و تقسيم به مساحت مي کنيم . 11 مقدمه اي بر پردازش تصوير ‏ به عنوان مثال براي بدست آوردن مرکز آبجکت زير : همانطور که مشاهده مي کنيد مرکز آبجکت 3و 5است . 12 اصطالحات مقدمه اي بر پردازش تصوير ‏ اصطالحات تشخيص الگو ( ) Pattern Recognition فرض کنيد مي خواهيد تشخيص دهيد که آبجکتي که در تصوير است دايره است يا خير .به اين عمل که توسط مغز کامپيتر انجام ميشود تشخيص الگو گفته مي شود . برا ي اين منظور بايد به دنبال ويژگي منحصر به فردي در دايره باشيم .به عنوان مثال مثال در مغز انسان ,دايره مکان هندسي نقاطي است که فاصله آنها از يک نقطه مشخص از آن در ذهن دارد . در دايره ويژگي منحصر به فرد P2/S = 4Rاست .البته بايد به اين نکته توجه کرد که منحصر به فرد بودن اين ويژگي در اشکال هندسي و در آبجکت هاي بي شکل صادق نيست . ‏ 13 روند تشخيص الگو در کامپيوتر به شکل زير است : مقدمه اي بر پردازش تصوير ‏ اصطالحات شماره گذاري آبجکت هاي درون تصوير براي تشخيص اينکه چه تعداد آبجکت در تصوير وجود دارد و هر کدام از پيکسل هل متعلق به کدام آبجکت است از روش هاي مختلفي استفاده مي شود و به اين عمل Component Labelingيا شماره گذاري اجزاء گفته مي شود . براي اختصار آخرين و سريع ترين الگوريتم موجود را برسي مي کنيم : 14 مقدمه اي بر پردازش تصوير اصطالحات ماتريسي که در صفحه قبل مشاهده مي کنيد يک تصوير به فرض سياو و سفيد است ( رنگ هايي که در تصوير مشاهده مي کنيد براي جدا کردن آبجکت ها است ) در خانه هايي که آبجکتي وجود ندارد مقدار صفر و در پيکسل هايي که آبجکت وجود دارد عدد يک وجود دارد . از سطر اول شروع مي کنيم و آنقدر در سطر حرکت مي کنيم تا به اولين پيکسلي که حاوي مقدار 1است برسيم ,اين پيکسل را به عنوان اولين آبجکت در نظر مي گيريم .کار را ادامه مي دهيم در سطر بعد اولين مقدار 1که رسيديم همسايه هاي 8گانه آنرا نگاه مي کنيم .اگر بين پيکسلي که قبال نشانه گذاري کرده بوديم و پيکسلي که االن به آن رسيديم مسيري وجود داشت ,اين 2پيکسل هر دو از يک آبجکت هستند ,پس به اين پيکسل نيز برچسب همان پيکسل قبلي را مي زنيم .کار ادامه پيدا مي کند تا جايي که به پيکسلي ميرسيم که در شکل مشخص شده است که متعلق به آبجکت يک است ولي در همسايگي آن پيکسل برچسب گذاري نشده است . 15 مقدمه اي بر پردازش تصوير اصطالحات بدون در نظر گرفتن اين موضوع برچسب جديدي را به آن مي زنيم .کار را به همين صورت ادامه ميدهيم ته به پايان برسيم . نک ته قابل توجه اينجاست که آبجکت هايي که با 2برچسب مشخص شده اند در جايي اين 2پيکسل به هم ميرسند .در بار دوم که ماتريس تصوير را رفرش مي کنيم به محل تالقي برچسب ها که رسيديم مقدار برچسب کوچکتر را در برچسب هاي بزرگتر قرار مي دهيم .حال با 2بار رفرش کردن تصوير با فرض سياه و سفيد بودن تصوير مي توان تمامي آبجکت ها را مشخص و جدا کرد . 16 مقدمه اي بر پردازش تصوير ‏ اصطالحات فاصله بين 2آبجکت مينيمم پيکسل هاي موجود بين 2آبجکت . کاربرد اين کار به عنوان مثال سرعت سنج اتومبيل در اتوبان ها است. ‏ تشخيص لبه در يک تصوير دليل ايجاد بک لبه در تصوير اختالف شدت نور در 2طرف آن محل است که به ان لبه مي گوييم .لبه ها قسمتي از تصوير هستند که اشتخوان بندي تصوير را مشخص مي کنند. ‏ انواع لبه ها - 1 :لبه عمودي - 3لبه مورب 17 - 2لبه افقي مقدمه اي بر پردازش تصوير ‏ اصطالحات براي يافتن لبه ها به شکل زير عمل مي کنيم : ‏ براي لبه هاي افقي از ستون اول به صورت عمودي شروع به حرکت مي کنيم و هر پيکسل را با پيکسل قبل از خودش مقايسه مي کنيم اگر تفاوت آنها از عدد مشخصي بيشتر باشد آنجا لبه است .در غيراين صورت به آن کاري نداريم . ‏ يافتن لبه هاي عمودي هم به همين صورت است منتها به صورت افقي شروع به حرکت مي کنيم . ‏ لبه هاي مورب ميشه گفت ترکيبي از اين 2لبه اند به اين صورت که جذر جمع مختصات هر پيکسل بايد از عددي مشخص بيشتر باشد در غير اين صورت لبه نيست . 18 مقدمه اي بر پردازش تصوير ‏ اصطالحات بزرگ نمايي) :) Zoom براي بزرگ نمايي يا کوچک نمايي تصوير الگوريتم هاي مختلفي وجود دارد که ما به ساده ترين آنها اشاره مي کنيم . براي 2برابر کردن تصوير بين هر سطر و ستون يک سطر و ستون اضافه قرار مي دهيم و مقدار آن را ميانگين 2پيکسل کناري آن قرار مي دهيم . براي 1/2کردن تصوير به صورت يکي در ميان سطر و ستون ها را حذف مي کنيم .همين روش را براي Nبرابر و N/1برابر کردن استفاده مي کنيم . 19 معرفي چند کاربرد ‏ كاربردهاي بازشناسي الگو در پردازش تصوير شناسايي الگو ( ادامه ) ... شناسايي الگو يکی از شاخه هاي هوش مصنوعي است كه با طبقه بندي (كالسه بندي) و توصيف مشاهدات سروكار دارد . .شناسايي الگو به ما كمك مي كند تا داده ها (الگوها) را با تكيه بر دانش قبلي يا اطالعات آماري استخراج شده از الگوها ،طبقه بندي نماييم .الگوهايي كه مي بايست كالسه بندي شوند ،معموال گروهي از سنجش ها يا اهداف هستند كه مجموعه نقاطي را در يك فضاي چند بعدي مناسب تعريف مي نمايند. ‏ كاربردهاي بازشناسي الگو بازشناسي الگو در بسياري از زمينه ها نقش كاربردي دارد .بازشناسي حروف ،بازشناسي نويسنده ،تصديق امضاء ،طبقه بندي اثر انگشت و بازشناسي گفتار نمونه هايي از اين كاربردها هستند .شناسايي الگو براي تحليل داد ه هاي پزشكي نيز بكار گرفته شده است. 20 معرفي چند کاربرد ‏ كاربردهاي بازشناسي الگو در پردازش تصوير كاربردهاي بازشناسي الگو براي مثال تفسيرالكتروكارديوگرام ،تحليل تصاوير اشعه Xو طبقه بندي كروموزم ها را مي توان نام برد. نمونه هاي ديگري از اين كاربردها شامل طبقه بندي مناطق زراعي ،مطالعه آلودگي آب ها ،آشكار كردن منابع زيرزميني و پيش بيني آب و هواست .در اين نوع كاربردها ،تصاوير ارسال شده از ماهواره و تصاوير هوايي به كمك روش هاي بازشناسي الگو تفسير مي شوند .بازرسي تصويري و بازشناسي قطعات ماشيني ،از كاربردهاي صنعتي شناسايي الگو هستند .تحليل بافت ، آشكارسازي هدف در سيگنال هاي برگشتي رادار يا سونار ،طبقه بندي امواج زلزله و تشخيص ذرات شيميائي كاربردهاي ديگري از بازشناسي الگو مي باشند. 21 بازشناسي نوري حروف ( ) OCR ‏ مقدمه مقدمه اي بر پردازش متن افزايش روزافزون توليد اطالعات كه غالبًا به صورت مواد چاپي به بازار عرضه مي گردد و ضرورت دسترسي سريع و آسان به داده هاي موجود از يك سو ،و حضور فراگير رايانه در عرصه هاي مختلف زندگي از سوي ديگر ،متخصصان فناوري اطالعات را بر آن داشته كه همواره در پي يافتن راهكار مناسب براي گردآوري و پردازش اطالعات به كمك رايانه باشند .تبديل اطالعات متني با مشخصه هاي متفاوت به مستندات متني استاندارد کامپيوتري ي کي از راهکارهاي افزايش بازدهي فناوري اطالعات است. مزيت متن واقعي به ساير اشکال يک مستند بطور خالصه عبارتند از: ‏ ‏ ‏ 22 متن ،قابل ويرايش و جستجو است و به آساني مي توان آنرا پردازش کرد .امکان جستجوي عبارات در يک متن حجيم ،امتياز بزرگي است. حجم متن معموال بسيار کمتر از حجم تصوير مشابه است. به متن ميتوان بسادگي توضيح ،فرالينک ،و امکانات رسانه مرکب افزود. بازشناسي نوري حروف ( ) OCR ‏ مقدمه (OCR ) Optical Character Recognition هنگامي كه يك سند متني اسكن مي شود ،كامپيوتر اين متن را بصورت يك تصوير گرافيكي تشخيص ميدهد .در نتيجه كاربران قادر نخواهند بود كه متن موجود در تصوير سند را ويرايش نمايند و يا آن را مورد جستجو قرار دهند .يك نرم افزار OCRاين متن اسكن شده را خوانده و محتويات آنرا شناسايي نموده ،و بصورت يك فايل در كامپيوتر ذخيره مي سازد .چنين قابليتي امكان استفادة گسترده از كامپيوتر را در پردازش سريع حجم وسيعي از داده هاي مكتوب توليد شده توسط شركتها و مؤسسات مختلف نظير بانكها ،شركتهاي بيمه ،مؤسسات خدمات عمومي ،ادارة پست و ساير نهادهايي كه ساليانه با ميليونها مورد پرداخت ،دريافت و حسابرسي امور مشتريان خود مواجه اند ،فراهم ميآورد. کاربردهاي ديگر آن شامل تبديل کتاب‌ها يا اسناد اسکن شده به فايل‌هاي متني ,مرتب کردن چک‌ها در بانک‌ها ،خواندن آدرس‌ بسته‌هاي پستي و مرتب کردن خودکار آدرس ها ،کمک به افراد نابينا با خواندن متون براي آنها ،ارتباط بين انسان و ماشين با استفاده ازتحرير عادي دستي ،و بسياري کاربردهاي ديگر مي‌شود. 23 بازشناسي نوري حروف ( ) OCR ‏ تاريخچه تاريخچه سيستم هاي OCR از جنبه تاريخي ،سيستم‌هاي OCRتا كنون مراحل تكاملي زيادي را پشت سر گذاشته‌اند : اولين اقدامات صورت گرفته در زمينة بازشناسي حروف ,در سال‌هاي اول دهه 1900انجام گرفته است که دانشمندان روسي مي خواستند به افراد مبتال به نارسايي‌هاي بينايي كمك نمايد .اولين اختراع‌هاي ثبت‌شده در اين زمينه مربوط به سال‌هاي 1929و 1933ميالدي هستند .اين سيستم‌ ها حروف چاپي را با روش تطبيق قالب شناسايي مي‌كردند .به اين صورت كه ماسك‌هاي مكانيكي مختلفي از مقابل تصوير حرف عبور مي‌كردند و نور از يك سو به آن تابانده مي‌شد و از سوي ديگر توسط يك آشكارساز نوري دريافت مي‌گرديد .وقتي يك انطباق كامل صورت مي‌گرفت ،نور به آشكارساز نمي‌رسيد و حرف ورودي بازشناسي مي‌شد .اين اختراع به دليل فناوري پائين مورد استفاده در آن ،كاربردي نبود و با ظهور کامپيوترهاي ديجيتال به صورت يك رؤيا باقي ماند . 24 بازشناسي نوري حروف ( ) OCR تاريخچه اقدامات اوليه در زمينه ،OCRبر متون چاپي يا مجموعه كوچكي از حروف و نمادهاي دستنويس كه براحتي قابل تشخيص بودند متمركز گرديده بود که عمدتًا از روش تطبيق قالب استفاده مي‌نمودند به اين صورت كه در آن تصوير ورودي با مجموعه بزرگي از تصاوير حروف مورد مقايسه قرار مي‌گرفت .در اين دوره ،تحقيقات موفق اما محدود شده (منظور از محدود شده، مفروض دانستن شرايط و پيش‌فرض‌هاي خاص براي كاراكترهاي ورودي است) ،بيشتر بر روي حروف و اعداد التين انجام گرفت .با اين حال مطالعات چندي نيز بر روي حروف ژاپني ،چيني ،عبري ،هندي ،سيريليكي ،يوناني و عربي در هر دو زمينه حروف چاپي و دستنويس آغاز گرديد .مطالعات صورت گرفته تا قبل از سال 1980بدليل فقدان سخت‌افزارهاي قدرتمند و دستگاه‌هاي ورودي مناسب با مشكل همراه بودند .اما از دهه 1980به بعد بواسطه رشد انفجارگونه فناوري اطالعات، وضعيت بسيار مناسبي براي تحقيقات مختلف از جمله بازشناسي حروف فراهم گرديد . 25 بازشناسي نوري حروف ( ) OCR تاريخچه در اين مقطع زماني بود كه با تكوين ابزارها و تكنيك‌ هاي پردازشي جديد ،پيشرفت واقعي در سيستم‌هاي OCRمحقق گرديد .در اوايل دهه ،90روش‌ هاي پردازش تصوير و بازشناسي الگو با تكنيك‌هاي كارآمد هوش مصنوعي ادغام گشتند .محققان، الگوريتمهاي پيچيده‌ اي را در بازشناسي حروف ابداع نمودند كه قادر بودند داده‌هاي ورودي با تفكيك‌پذيري باال را دريافت كنند ‌ و در مرحله پياده‌ سازي ،محاسبات بسيار زيادي را بر روي داده‌ ها انجام دهند .امروزه عالوه بر وجود رايانه‌هاي قدرتمندتر و تجهيزات الكترونيكي دقيق‌تر مانند اسكنرها ،دوربين‌ها و صفحات رقمي‌كننده ،استفاده از تكنيك‌هاي پردازشي مدرن و توانمند همچون شبكه‌هاي عصبي ،مدل‌هاي ماركوف پنهان ،منطق‌ فازي ،و مدل‌هاي پردازش زبان طبيعي امكان‌پذير گشته است . 26 بازشناسي نوري حروف ( ) OCR ‏ ‏ 27 بررسي اجزا و انواع سيستم OCR در يك تقسيم بندي كلي ميتوان سيستمهاي OCRرا از لحاظ نوع الگوي ورودي به دو گروه تقسيم کرد : ‏ سيستمهاي بازشناسي متون چاپي ‏ سيستمهاي بازشناسي متون دستنويس همچنين از جنبه نحوه ورود اطالعات ،سيستمهاي OCRبه دو دستة زير تقسيم بندي مي شوند : ‏ سيستمهاي بر خط ‏ سيستمهاي برون خط بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR در بازشناسي برخط ،حروف در همان زمان نگارش توسط سيستم تشخيص داده ميشوند .دستگاه ورودي اين سيستمها يك قلم نوري است .در اين روش عالوه بر اطالعات مربوط به موقعيت قلم ،اطالعات زماني مربوط به مسير قلم نيز در اختيار است .اين اطالعات معموً ال توسط يك صفحة رقومي كننده اخذ مي شوند .در اين روش مي توان از اطالعات زماني سرعت، شتاب ،فشار و زمان برداشتن و گذاشتن قلم روي صفحه در بازشناسي استفاده كرد. ‏ در بازشناسي برون خط ،از تصوير دو بعدي متن ورودي استفاده مي شود .در اين روش به هيچ نوع وسيله نگارش خاصي نياز نيست و تفسير داد ه ها مستقل از فرآيند توليد آنها تنها براساس تصوير متن صورت مي گيرد .اين روش به نحوة بازشناسي توسط انسان شباهت بيشتري دارد. 28 بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR بخشهاي مختلف يك سيستم OCRکامل الف‐ پيش پردازش :شامل كلية اعمالي كه روي سيگنال تصويري خام صورت ميگيرند تا موجب تسهيل روند اجراي فازهاي بعدي گردند؛ مانند باينري كردن تصوير ،حذف نويز ،هموارسازي ،نازك سازي ،تشخيص زبان و فونت كلمات و نظاير اينها. ب‐ قطعه بندي :عبارت است از روش هايي كه بخش هاي مختلفي همچون پاراگراف ها ،جمالت يا كلمات ،و حروف را از تصوير سند استخراج مي نمايند. ج‐ استخراج ويژگي ها :مجموعة كلية محاسباتي است كه روي الگوهاي بدست آمده از مرحلة پيش پردازش انجام ميشود تا بردار ويژگي هاي متناظر با هر الگو تعيين گردد. 29 بازشناسي نوري حروف ( ) OCR بررسي اجزا و انواع سيستم OCR د‐ بازشناسي با يك يا چند طبقه بندي كننده : شامل روش هايي براي متناظر ساختن هر يك از الگوهاي بدست آمده از مرحلة استخراج ويژگي ها با يكي از كالس هاي فضاي الگوهاي مورد بحث است كه از طريق كمينه ساختن فاصلة بردار ويژگي هاي هر الگو نسبت به يكي از بردارهاي مرجع موجود در پايگاه داده هاي سيستم انجام مي گيرد. ه -بكارگيري اطالعات جانبي (پس پردازش) : مانند مجموعه لغات معتبر ،اطالعات آماري مربوط به رخداد حروف ،اطالعات دستوري و معنايي. 30 بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR سيستم هاي OCRفارسي مسئلة بازشناسي حروف الفباي فارسي سابقهاي نه چندان طوالني به همراه دارد .نخستين گزارشهاي رسمي منتشر شده از تالشهاي انجام گرفته در اين راه ،مربوط به ساليان نخست دهة ۱۹۸۰ميالدي است به رغم فراگيري نسبي كاربرد الفباي فارسي در ميان ملل مختلف قارة آسيا ،بررسيهاي انجام شده در خصوص يافتن روشهايي براي بازشناسي حروف اين الفبا بسيار محدود بوده است .بواسطة وجود تفاوتهاي اساسي بين نحوة نگارش كلمات فارسي و كلمات التين نظير چسبيده بودن حروف سازندة يك كلمه به يكديگر و تغيير شكل حروف بر اساس موقعيت نسبي قرارگيري آن در يك كلمة فارسي ،امكان اعمال مستقيم روشهاي متداول در بازشناسي حروف انگليسي بنظور شناسايي حروف تشكيل دهندة كلمات فارسي وجود ندارد. 31 بازشناسي نوري حروف ( ) OCR بررسي اجزا و انواع سيستم OCR در حال حاضر يکی از نرم افزار تجاري كارآمد OCRکه زبان فارسي را پشتيباني مي کند Automatic Readerمحصول شرکت عربي Sakhrاست که داراي 2نخسه Goldو Platinumميباشد .در حال حاضر قيمت نسخه 0.7آن 4000 و 1400دالر است .اين رقم در مقايسه با قيمت نرم افزار هاي معروفي همچون Officeکه حداکثر 600دالر مي باشد واقًع ا قابل مالحظه ميباشد . همچنين شركت "جيحونافزار” يک نرم افزار OCRفارسي بنام “شناسا” ( )ShenAsAداشت كه قيمت آن در سال ۱۹۹۶حدود ۱۰۰۰دالر بود اما ظاهًر ا از كارايي چندان مورد قبولي برخوردار نبود چون متاسفانه حاصل فارسي سازي سطحي نسخه هاي قبلي و فعلي محصوالت صخر هستند که در مواردي تنها به فارسي سازي منوها اکتفا شده است . نرم افزار ديگری به نام Readiris Pro 11 Middle Eastبه تازگی منتشر شده که زبان فارسی را هم پشتيبانی مي کند. 32 بازشناسي نوري حروف ( ) OCR بررسي اجزا و انواع سيستم OCR در نسخه هاي پيشين اين نرم افزار زبان فارسي وجود نداشت و تنها با استفاده از امکان عربي آن ميشد پردازش ناقصي انجام داد . اين نرم افزار با قيمت 300.000دالر به فروش رسيد ! به داليل گفته شده OCRدرمرحلة كنوني در كشور ما مربوط به «دست‌نويس‌هاي گسسته» يا متن‌هاي تايپي پيوسته است ،و تا بازشناسي متن‌هاي دست‌نويس پيوسته توسط كامپيوتر راه زيادي در پيش است ،چون در دست‌نويس‌هاي گسسته ،اگرچه حروف به هم شباهت دارند ،حداقل جداجدا نوشته شده‌اند .در متن‌هاي پيوسته تايپي هم مشكل كشيده شدن يك حرف يا شكسته نوشته شدن حروف را نداريم. البته به گفته مسئوالن شركت «پايا» در حال حاضر هم نرم‌افزارهايي وجود دارد كه متن دست‌نويس پيوسته را تبديل به حروف جدا ازهم و گسسته مي‌كنند ،ولي ضريب خطاي اين نرم‌افزارها زياد است و به شكل صنعتي درنيامده‌اند. نرم افزار های ديگر Omni Page Pro 12 - ABBYY FineReader - Text Bridge : 33 بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR مشکالت و پيچيدگي هاي پيش روي OCRهاي فارسي و عربي نگارش فارسي ،ويژگي‌هاي منحصر به فردي دارد كه آن را كامًال از نگارش التين متمايز مي‌سازد .به منظور فعاليت در حوزه OCR فارسي ،آگاهي از قوانين نگارشي و نحوه چاپ حروف در اين زبان ،امري ضروري است : ‏ در كلمات فارسي برخي از حروف از يك يا دو طرف به حروف مجاور خود اتصال دارند و برخي نيز به صورت مجزا نوشته مي‌شوند .در نتيجه هر كلمه ممكن است شامل يك يا چند بخش متصل باشد كه «زيركلمه» ناميده مي‌شوند .چسبيده يا سرهم بودن حروف در نگارش فارسي ،بازشناسي متون فارسي را براي سيستم‌هاي ،OCRنسبت به متون التين بسيار مشكل‌تر مي‌سازد. ‏ حروف فارسي ممكن است چهار موقعيت مجزا و در نتيجه چهار شكل متفاوت نگارش داشته باشند :حروف ابتدايي ،مياني، انتهايي و مجزا .نهايتا حدود 100شکل مختلف حرف و عدد در مجموعه تشخيص وجود خواهند داشت. 34 بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR حروف واقع در يك كلمه ممكن است همپوشاني داشته باشند ،بدين معنا كه نتوان با رسم خطوط عمودي ،حروف را به طور كامل از يكديگر مجزا نمود. ‏ متون فارسي برخالف متون التين از راست به چپ نوشته مي‌شوند. ‏ در برخي از فونت‌ ها بعضي از حروف ،از يك سمت در دو محل به يكديگر اتصال دارند. ‏ برخي از حروف بين يك تا سه نقطه دارند كه ممكن است در باال يا پايين بدنه حرف واقع باشند. ‏ بعضي از حروف بدنه مشابه دارند و تفاوت آن‌ ها تنها در تعداد و محل قرارگيري نقاط يا در وجود يك سركش است (مانند «ك» و «گ») كه در مقايسه با بدنه حروف ،اندازه بسيار كوچكي دارند .اين موضوع نيز يكي از مواردي است كه بر پيچيدگي سيستمهاي OCRفارسي مي‌افزايد. ‌ ‏ 35 حروفي كه از طرف چپ قابليت اتصال به حرف مجاور خود را دارند ،ممكن است به صورت كشيده نوشته شوند. بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR اصلياند و اعراب ً -در ‌ اعرابهاي ‌ حروف فارسي ممكن است در باال يا پايين بدنه داراي اعراب باشند .سه اعراب َ -ُ -ِ -در زبان فارسي، ميشود (نظير كلمات «عمدًا» و «احتماًال») .كلمات عربي داراي اعراب ٌ -و ٍ -در زبان فارسي برخي كلمات عربي رايج در زبان فارسي ديده ‌ كلمهاي نامتداول باشد يا ‌ عموميت نيافته‌اند .هر چند كاربرد اعراب در زبان فارسي نسبت به زبان عربي بسيار محدودتر است ،اما اگر ميشود .ضمنا در باالي بدنه يك نشانههاي اعراب استفاده ‌ ‌ به دليل تشابه نگارشي آن با كلمه ديگر ،تأكيد بر تلفظ صحيح آن باشد ،از حرف ممكن است عالمت تشديد وجود داشته باشد و برخي از حروف داراي عالمت همزه هستند. ‏ ميتواند سيستم را به اشتباه بيندازد؛ اعداد ،4 دربارة اعداد فارسي هم اين مشكل وجود دارد :صفر ما تنها يك نقطه كوچك است كه ‌ 1 ،2 ،3هم بسيار به هم شبيه هستند و تنها تفاوتشان در دندانه ها است. ‏ در متون دستنويس فارسي ،تنوع تحرير بسيار زياد است .انواع شکلها براي حروفي مانند س ،ي ،ها و غيره متصور است .در تحرير دستنويس از سوي ديگر مشخصه هاي حرکت قلم نيز قابل تحليل هستند. 36 بازشناسي نوري حروف ( ) OCR ‏ بررسي اجزا و انواع سيستم OCR بيشتر حروف فارسي (مخصوصًا حروف چسبيده) دندانه‌دار هستند .در مواردي كه كيفيت سند اصلي يا دستگاه اسكنر پايين باشد ،ارتفاع دندانه‌ها نسبت به خط زمينه كوتاه مي‌ شود و اين امر ،شناسايي صحيح اين حروف در مرحله قطعه‌بندي يا بازشناسي را با مشكل مواجه مي‌سازد. 37 بازشناسي نوري حروف ( ) OCR ‏ تحليل بخشهاي مختلف سيستمهاي OCR ‏ پيش پردازش تحليل بخشهاي مختلف سيستمهايOCR اين مرحله شامل كلية پردازشهايي است كه بر روي سيگنال هاي تصويري خام انجام مي شوند تا موجب تسهيل يا افزايش دقت روند اجراي فازهاي بعدي گردند .از مجموعة اين پردازشها هدفهاي زير دنبال مي شود : ‐۱كاهش نويز. ‐۲نرماليزه نمودن داده ها. ‐۳فشرده سازي ميزان اطالعاتي كه مي بايست محفوظ بماند. 38 بازشناسي نوري حروف ( ) OCR ‏ تحليل بخشهاي مختلف سيستمهايOCR كاهش نويز نويز ايجاد شده بواسطة دستگاه هاي اسكنر نوري يا ابزارهاي نگارشي منجر به ايجاد قطعه خط هاي گسسته ،اتصال بين خطوط ،فضاهاي خالي در خطوط متن ،پر شدن حفره هاي موجود در تصوير برخي حروف و غيره مي گردد .همچنين اعوجاج هاي مختلف شامل تغييرات محلي، منحني شدن گوشه هاي حروف ،تغيير شكل و يا خوردگي حروف را نيز بايستي مد نظر قرار داد .قبل از مرحلة بازشناسي حروف الزم است كه اين نقايص برطرف شوند .تكنيك هاي مختلف كاهش نويز را مي توان به سه گروه اصلي دسته بندي نمود : الف‐ فيلتر كردن ب‐ عملگرهاي مورفولوژي ج‐ مدلسازي نويز 39 بازشناسي نوري حروف ( ) OCR ‏ 40 كاهش نويز تحليل بخشهاي مختلف سيستمهايOCR بازشناسي نوري حروف ( ) OCR ‏ تحليل بخشهاي مختلف سيستمهايOCR نرماليزه كردن داده ها روش هاي نرماليزه كردن داده ها به حذف تغييرات نگارشي كمك نموده ،داده هاي استاندارد شده اي را نتيجه مي دهد .روش هاي پاية نرماليزه كردن عبارتند از: الف‐ نرماليزه كردن كجي متن و استخراج خطوط زمينه ب‐ نرماليزه كردن اريب شدگي ج‐ نرماليزه كردن (تغيير مقياس دادن) اندازه د‐ هموارسازي كانتور هر کدام از اين مباحث به تنهايي قابل بحث و شرح مي باشند که ما در اين بحث به خالصه اي از هر کدام از اين موارد مي پردازيم . 41 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR الف -نرماليزه كردن كجي متن و استخراج خطوط زمينه بديل عدم دقت در مرحلة اسكن و يا بي دقتي نويسنده در هنگام نگارش متن دستنويس ،ممكن است خطوط متن نسبت به تصوير اندكي انحراف يا چرخش داشته باشند ,اين مسئله مي تواند كارايي الگوريتم هاي بكار رفته در طبقات بعدي سيستم OCRرا تأثير قرار دهد ,چرا كه يكي از مفروضات بيشتر روشهاي قطعه بندي ،عدم كج بودن تصوير متن ورودي است و در نتيجه الزم است كه اين نقيصه آشكار و تصحيح گردد .آشكارسازي خط زمينه در بسياري از تكنيكهاي قطعه بندي و بازشناسي متون فارسي ،عربي و التين نقش اساسي دارد .عالوه بر اين ،برخي از كاراكترها را ميتوان بواسطة موقعيت نسبيشان نسبت به خط زمينه آشكار ساخت. 42 بازشناسي نوري حروف ( ) OCR ‏ روش هاي بكار رفته جهت تصحيح كجي خطوط زمينه در متون التين عبارتند از : ‐۱بكارگيري هيستوگرام ( پروفايل تصويرنمايي ) تصوير ‐۲استفاده از روش خوشه بندي نزديكترين همسايه ها ‐۳روش همبستگي متقابل بين حروف ‐۴تبديل هاف 43 تحليل بخشهاي مختلف سيستمهايOCR بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ب‐ نرماليزه كردن اريب شدگي در متون چاپي فارسي و التين ،كاراكترهاي داراي فرمت ايتاليك از راستاي عمود انحراف دارند .همچنين در متون دستنويس برخي از نويسنده ها حروف را بصورت زاويه دار مي نويسند .اين شناخته مي شود و مي تواند دقت برخي از الگوريتم هاي قطعه بندي « اريب شدگي » پديده تحت عنوان يا بازشناسي را تحت تأثير قرار دهد و لذا در اين سيستم ها الزم است كه در مرحلة پيش پردازش ،ميزان اريب بودن كاراكترها شناسايي و تصحيح گردد. اريبشدگي بصورت زاوية شيب بين طويل ترين زيرحرف در يك كلمه و جهت عمودي تعريف مي شود .نرماليزه كردن اريب ،بنظور نرماليزه نمودن كلية كاراكترها به يك فرم استاندارد بكار مي رود .معمول ترين روش در تخمين ميزان اريب شدگي ،محاسبة زاوية متوسط اجزاء نزديك به خط عمود است .استخراج خطوط عمودي از كاراكترها بوسيلة يك جفت فيلتر يك بعدي انجام مي پذيرد .مختصات شروع و پايان هر خط ،زاوية اريب را بدست مي دهد. 44 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ج‐ نرماليزه كردن (تغيير مقياس دادن) اندازه در سيستم هاي OCRاغلب تصاوير كلمات خيلي كوچك يا خيلي بزرگ ،به يك اندازة استاندارد نرماليزه مي شوند .اين عمل معمو ال با نمونه برداري مجدد ٢تصوير انجام ميگيرد .روش هايي نظير Bilinearيا Bicubicبر روي تصاوير سطح خاكستري بنحو مناسبي عمل ميكنند ,اما عمليات نمونه برداري موجود در آنها ،كاراكترهاي دوسطحي را دچار اعوجاج مي سازند .يك راهكار استاندارد ،اعمال يك روال دو مرحله اي است كه در آن ابتدا كانتور هموار اصلي مربوط به كاراكتر نمونه برداري شده ،توسط يك فيلتر كانولوشن وزندار ١و كوانتيزاسيون دوسطحي دامنه ٢تقريب زده مي شود و پس از آن عمل نمونه برداري مجدد انجام مي گيرد .روش هاي بازشناسي حروف ممكن است نرماليزه كردن اندازه را در هر دو جهت افقي و عمودي انجام دهند .در هر كاراكتر به تعدادي ناحيه تقسيم ميشود و هر يك از اين نواحي ،بصورت جداگانه تغيير مقياس داده مي شوند. 45 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR د‐ هموارسازي كانتور در متون دستنويس ،بواسطة لرزش يا حركات ناخواستة دست نويسنده هنگام نگارش ،ممكن است كه كانتور حروف شكل ناصاف پيدا كند .همچنين اين مسئله ميتواند در سيستمهاي بازشناسي متون چاپي و دستنويس بدليل تغيير مقياس حروف و يا وجود نويز در مرحلة اسكن تصاوير نيز ظاهر گردد .روشهاي هموارسازي كانتور بمنظور جبران اين نقيصه مورد استفاده قرار ميگيرند .بطور كلي هموارسازي كانتور تعداد نقاط نمونة مورد نياز براي بازنمايي كاراكتر را كاهش ميدهد و در نتيجه كارايي مراحل پردازشي باقيمانده را بهبود مي بخشد .در مقدار هر پيكسل از تصوير متن با مقدار ميانگين وزني پيكسل هاي همساية آن جايگزين ميشود كه با دو بار تكرار اين عمل ،تصوير هموارتري از متن دستنويس بدست ميآيد و در نتيجه اثر لرزش دست نويسنده كاهش پيدا ميكند . 46 بازشناسي نوري حروف ( ) OCR ‏ تحليل بخشهاي مختلف سيستمهايOCR فشرده سازي اين مسئله پذيرفته شده است كه تكنيكهاي كالسيك فشرده سازي تصاوير كه تصوير را از حوزة مكاني به حوزه هاي ديگر منتقل مي كنند ،براي بازشناسي حروف مناسب نمي باشند .در بازشناسي حروف ،عمل فشرده سازي نيازمند آن دسته از تكنيك هاي حوزة مكاني است كه اطالعات شكلي را حفظ مي نمايند .دو تكنيك متعارف فشرده سازي ،يكي تكنيك اعمال سطح آستانه بمنظور باينري كردن تصاوير سطح خاكستري متون و ديگري نازك سازي مي باشد . الف‐ باينري (دوسطحي) كردن تصوير متن : بمنظور كاهش حجم ذخيره سازي مورد نياز و افزايش سرعت پردازش ،اغلب مطلوب است كه با انتخاب يك سطح آستانه ،تصاوير سطح خاكستري يا رنگي را به تصاوير باينري تبديل نمود. 47 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ب‐ نازك سازي اين عمل درحاليكه كاهش قابل مالحظه اي در حجم داده ها ايجاد ميكند ،اطالعات شكلي كاراكتر را نيز استخراج مي نمايد .دو روش پايه براي نازكسازي عبارتند از « نازكسازي از طريق پيكسل » « ,نازكسازي غير از طريق پيكسل » . نازكسازي از طريق پيكسل بصورت محلي و تكراري تصوير را مورد پردازش قرار مي دهد تا وقتي كه از تصوير كاراكتر تنها اسكلت آن به عرض يك پيكسل باقي بماند .اين روش نسبت به نويز بسيار حساس بوده ،ممكن است تصوير كاراكتر را مخدوش سازد. از سوي ديگر ،روش هاي نازك سازي غير از طريق پيكسل ،طي فرايند نازك سازي مقداري از اطالعات سراسري دربارة كاراكتر را مورد استفاده قرار مي دهند. 48 بازشناسي نوري حروف ( ) OCR ب‐ نازك سازي 49 تحليل بخشهاي مختلف سيستمهايOCR بازشناسي نوري حروف ( ) OCR ‏ تحليل بخشهاي مختلف سيستمهايOCR قطعه بندي مرحلة پيش پردازش يك تصوير اصالح شده از سند را نتيجه مي دهد بگونه اي كه مقدار كافي از اطالعات شكلي ،فشرده سازي باال و نويز نويز پايين ،از تصوير نرماليزه شدة سند قابل حصول يك مرحلة بسيار با اهميت در بازشناسي حروف مخصوًص ا حروف است .قطعه بندي فارسي و عربي كه بصورت پيوسته نوشته مي شوند مي باشد ,چرا كه نتيجة بدست آمده از جداسازي كلمات ،خطوط يا كاراكترها مستقيٌم ا بر روي نرخ بازشناسي سيستم تأثير مي گذارد. قطعه بندي غلط كاراكترها ،عامل بسياري از خطاهاي OCRاست ميزان دقت يك الگوريتم قطعه بندي به سبك نگارش حروف ،كيفيت دستگاه پرينت و نيز نسبت اندازة فونت به رزولوشن دستگاه اسكنر بستگي دارد . دو نوع قطعه بندي وجود دارد : الف) قطعه بندي بيروني ب) قطعه بندي دروني 50 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR الف -قطعه بندي بيروني : قطعه بندي بيروني كه عبارت است از جداسازي بخش هاي مختلف نگارش مانند پاراگراف ها ،جمالت يا كلمات . اين مرحله بحراني ترين و حساس ترين قسمت در زمينة آناليز اسناد ميباشد و يك مرحلة ضروري براي سيستم هاي بازشناسي حروف برونخط محسوب ميشود .گر چه مبحث آناليز اسناد با روش ها و تكنيك هاي خاص خود يك حوزة تحقيقاتي تا حدي متفاوت نسبت به OCRاست ,ليکن تقسيم بندي تصوير سند به نواحي متني و غير متني ،يك بخش الينفك نرمافزارهاي OCRبه حساب ميآيد. 51 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ب -قطعه بندي دروني : قطعه بندي دروني كه منظور از آن ،جداسازي حروف كلمات مخصوٌص ا در مورد كلمات سر هم نوشته شده در متون التين و يا رسمالخط هاي پيوسته نظير فارسي و عربي است .عليرغم فعاليت هاي چشمگير دهة گذشته و تنوع تكنيك هاي معرفي شده ،قطعه بندي متون پيوسته ( بخصوص متون دستنويس پيوسته ) به حروف هنوز هم بصورت يك مسئله باقي مانده است .روشه اي قطعه بندي حروف به سه دسته تقسيم مي شوند: الف‐ قطعه بندي صريح ب‐ قطعه بندي ضمني ج) تكنيك هاي ادغام شده 52 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR الف‐ قطعه بندي صريح در اين روش قطعات بر مبناي خاصيت حرفسان بودنشان (شباهت داشتن به يك حرف) .تشخيص داده مي شوند .فرآيند قطعه بندي تصوير به اجزاء بامعني يك نام خاص دارد :تشريح . تشريح فرايندي است كه يك تصوير را بدون بكارگيري يك كالس بخصوص از اطالعات شكلي تحليل مينمايد .معيار سنجش خوب بودن قطعه بندي ،هم خوان بودن خواص عمومي قطعات با خصوصيات مورد انتظار براي كاراكترهاي معتبر است. تكنيكهاي موجود مبتني بر تشريح يك تصوير عبارتند از : استفاده از فضاهاي خالي و نقاط اوج ،آناليز تصويرنمايي عمودي ،آناليز اجزاءپيوسته و عالئم مشخصه .عالوه بر اين ،ميتوان با بكارگيري قراين زبانشناختي ،قطعه بندي صريح را در معرض ارزشيابي قرار داد. 53 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ب‐ قطعه بندي ضمني اين روش قطعه بندي بر پاية بازشناسي است و تصوير سند را براي يافتن اجزايي كه با كالس هاي از قبل تعريف شدهاي مطابقت داشته باشند ،مورد جستجو قرار ميدهد .قطعه بندي ،بر مبناي ميزان صحت نحوي يا معنايي نتايج كلي حاصله از بازيابي انجام مي گيرد .در اين رويكرد ،دو ( گروه از روش ها قابل بكارگيري مي باشند ) روش هايي كه چندين روال جستجو را انجام مي دهند و روش هايي كه بردار ويژگي تصوير را قطعه بندي مينمايند. كالس نخست سعي در قطعه بندي كلمات به حروف يا ساير اجزاء بدون استفاده از الگوريتم هاي تشريح مبتني بر ويژگي دارد .به عبارت دقيقتر ،در اين روش بدون در نظر گرفتن محتوا ،تصوير بطور اصولي به قسمتهاي همپوشان تقسيم مي شود .از ديدگاه مفهومي ،اين دسته روش ها از تكنيك هايي كه براي بازشناسي كلمات چاپي توسعه داده شده اند ،نشأت مي گيرند. 54 بازشناسي نوري حروف ( ) OCR تحليل بخشهاي مختلف سيستمهايOCR ب‐ قطعه بندي ضمني ( ادامه ) .. كالس دوم از روش هاي قطعه بندي ضمني ،تصوير را با كالسه بندي زيرمجموعه هايي از ويژگي هاي مكاني (استخراج شده از كل تصوير) بطور ضمني قطعه بندي مي نمايد .اين خانواده از روش هاي مبتني بر بازشناسي ،از تكنيك هاي ماليم سازي احتماالتي ،مفهوم نقاط منتظم و نقاط تكين ،و تطابق بازگشتي استفاده مي نمايند. ج -تكنيكهاي ادغام شده اين تكنيك ها ،روش هاي قطعه بندي صريح و ضمني را در هم ميآميزند .يك الگوريتم تشريح با هدف قطعه بندي اضافي به تصوير اعمال مي شود ,بدين معني كه تصوير آنقدر به نواحي مختلف برش داده مي شود تا اطمينان حاصل گردد كه مرزهاي قطعه بندي صحيح نيز در ميان قطعات ايجاد شده موجود مي باشند .پس از حصول اطمينان ،قطعات ايجاد شده توسط تكنيك هاي كالسه بندي مورد ارزيابي قرار مي گيرند تا از ميان آنها قطعه بندي بهينه استخراج گردد. 55

62,000 تومان