tashkhise_dastkhat_ocr

در نمایش آنلاین پاورپوینت، ممکن است بعضی علائم، اعداد و حتی فونت‌ها به خوبی نمایش داده نشود. این مشکل در فایل اصلی پاورپوینت وجود ندارد.




  • جزئیات
  • امتیاز و نظرات
  • متن پاورپوینت

امتیاز

درحال ارسال
امتیاز کاربر [0 رای]

نقد و بررسی ها

هیچ نظری برای این پاورپوینت نوشته نشده است.

اولین کسی باشید که نظری می نویسد “تشخیص دست خط OCR”

تشخیص دست خط OCR

اسلاید 1: 1

اسلاید 2: تهیه کنندگان: هاجر عسکری عذرا مرادی فرد محبوبه عمویی استاد: دکتر میر کمالیموضوع:تشخیص دست خط 2

اسلاید 3: O C ROptical Character Recognitionنویسه خوان نوری 3

اسلاید 4: مقدمهاگر ما متنی را روی کاغذ داشته باشیم و بخواهیم عین متن را بدون تایپ کردن وارد کامپیوتر كنيم چکار باید بکنیم؟ ما به وسیله «اسكنر» می توانیم تصويری از آن متن را وارد کامپیوتر كنیم، اما این فقط یک تصویر است و نمی توان روی آن پردازش انجام داد.در واقع « تصوير ديجيتال‌شده» بايد به « تصوير قابل پردازش» تبدیل شودپردازش و آنالیز تصاویر میتواند به عنوان یک ساختار کاربردی و تکنیکی جهت تسخیرکردن، تصحیح کردن، زیاد کردن و تغییر شـکل دادن تصاویری که مشاهده می شود تعریف کرد. 4

اسلاید 5: موضوعیک سیستمOCR به ما این امکان را می دهد که یک کتـاب و یا یک مقاله را مستقیما به یک فایل الکترونیکی تبدیل نماییم و آن را با کمک یک پردازشگر تغییر دهیم این تکنولوژی مدتهاست که به وسیله کتابخانه ها وسازمان هـای دولتـی بـرای دسـتیابی الکترونیکـی سریع به مدارک حجیم به کارمی رود و از لحاظ سرعت و هزینـه روش مناسبی است .OCR از معدود زمینه های هوش مصنوعی است که میتوان در عمل به آن تکیه کرد. 5

اسلاید 6: تاريخچه سيستم هاي OCR اولين اقدامات صورت گرفته در زمينة بازشناسي حروف, در سال‌هاي اول دهه 1900 انجام گرفته است که دانشمندان روسي مي خواستند به افراد مبتلا به نارسايي‌هاي بينايي كمك نمايد.در ســـال1929 در آلمـــان و در ســـال 1933 در آمریکا ابداعاتی در زمینه OCR ثبت نمودند اینها اولین ایده ها ی شناسای ی حروف هستند.اولین کامپیوتر تجـار ی در سال 1951 در آمریکا شروع به کار کـرد. در ایـن زمـان بـود کـه ایـده OCR به عنوان یک پدیده قابل پیاده سازی پذیرفته شد.6

اسلاید 7: در اوايل دهه 90، روش‌هاي پردازش تصوير و بازشناسي الگو با تكنيك‌هاي كارآمد هوش مصنوعي ادغام گشتند.امروزه علاوه بر وجود رايانه‌هاي قدرتمندتر و تجهيزات الكترونيكي دقيق‌تر مانند اسكنرها، دوربين‌ها و صفحات رقمي‌كننده، استفاده از تكنيك‌هاي پردازشي مدرن و توانمند همچون شبكه‌هاي عصبي ، مدل‌هاي ماركوف پنهان ، منطق‌ فازي، و مدل‌هاي پردازش زبان طبيعي امكان‌پذير گشته است.7

اسلاید 8: OCR انواع8

اسلاید 9: Black Boxجعبه سیاه 9

اسلاید 10: 10

اسلاید 11: تصویری درباره نحوه استفاده ازOCR تکنولوژی 11

اسلاید 12: ساختار سلسله مراتبي آن DIA مبحثبازشناسي نوري حروف ( OCR )12

اسلاید 13: ویژگيهاي متون چاپي فارسي از نظرپردازش رایانه ايدر کلمات فارسی برخی از حروف از یک یا دو طرف به حروف مجاور خود اتصال دارند و برخی نیز بصورت مجزا نوشته می شوند. حروف فارسی ممکن است به چهار شکل متفاوت نگارش شوند. حروف واقع در یک کلمه ممکن است همپوشانی داشته باشند. در برخی از فونت ها بعضی از حروف، از یک سمت در دو محل به یکدیگر اتصال دارند.13

اسلاید 14: پیچیدگی هاي سیستم هايocr فارسیحروف فارسی ممکن است در بالا یا پایین بدنه داراي اعراب باشند. در بالاي بدنه یک حرف ممکن است علامت تشدید وجود داشته باشد.برخی از حروف داراي علامت همزه هستند. بیشتر حروف فارسی ( مخصوصا حروف چسبیده ) دندانه دار هستند.14

اسلاید 15: معرفی بخشهاي مختلف يك سيستم OCR15

اسلاید 16: پيش پردازششامل كلية اعمالي كه روي سيگنال تصويري خام صورت ميگيرند تا موجب تسهيل روند اجراي فازهاي بعدي گردند؛ مانند باينري كردن تصوير، حذف نويز. از مجموعة اين پردازشها هدفهاي زير دنبال مي شود:۱‐ كاهش نويز.۲‐ نرماليزه نمودن داده ها.۳‐ فشرده سازيتحليل بخشهاي مختلف سيستمهاي OCR16

اسلاید 17: كاهش نويز نويز ايجاد شده بواسطة دستگاه هاي اسكنر نوري يا ابزارهاي نگارشي منجر به ايجاد قطعه خط هاي گسسته، اتصال بين خطوط، فضاهاي خالي در خطوط متن، پر شدن حفره هاي موجود در تصوير برخي حروف و غيره مي گردد. همچنين اعوجاج هاي مختلف شامل تغييرات محلي، منحني شدن گوشه هاي حروف، تغيير شكل و يا خوردگي حروف را نيز بايستي مد نظر قرار داد. تحليل بخشهاي مختلف پیش پردازش17

اسلاید 18: كاهش نويزتحليل بخشهاي مختلف پیش پردازش18

اسلاید 19: نرماليزه كردن داده هاتحليل بخشهاي مختلف پیش پردازش19

اسلاید 20: نرماليزه كردن كجي متن و استخراج خطوط زمينهبه دلیل بی دقتی در مرحله اسکن یا بی دقتی نویسنده در هنگام نگارش متن دست نوشت، ممکن است خطوط متن نسبت به تصویر، اندکی انحراف یا چرخش داشته باشند.آشکارسازي خط زمینه در بسیاري از تکنیک هاي قطعه بندي و بازشناسی متون فارسی عربی لاتین، نقش اساسی دارد.نرماليزه كردن داده ها20

اسلاید 21: نرماليزه كردن اريب شدگيدر متون چاپي فارسي و لاتين ، كاراكترهاي داراي فرمت ايتاليك از راستاي عمود انحراف دارند. همچنين در متون دستنويس برخي از نويسنده ها حروف را بصورت زاويه دار مي نويسند. اين شناخته مي شود و مي تواند دقت برخي از الگوريتم هاي قطعه بندي « اريب شدگي » پديده تحت عنوان يا بازشناسي را تحت تأثير قرار دهد و لذا در اين سيستم ها لازم است كه در مرحلة پيش پردازش ، ميزان اريب بودن كاراكترها شناسايي و تصحيح گردد.نرماليزه كردن داده ها21

اسلاید 22: نرماليزه كردن (تغيير مقياس دادن) اندازه در سيستم هاي OCR اغلب تصاوير كلمات خيلي كوچك يا خيلي بزرگ، به يك اندازة استاندارد نرماليزه مي شوند. تا بدین ترتیب عملیات بازشناسی، مستقل از اندازه فونت متن گردد. اين عمل معمولا با نمونه برداري مجدد ٢ تصوير انجام ميگيردروش هايي نظير Bilinear يا Bicubic بر روي تصاوير سطح خاكستري به نحو مناسبي عمل ميكنند.نرماليزه كردن داده ها22

اسلاید 23: هموارسازي كانتورخط تشکیل دهنده مرز یک کاراکتر را کانتور آن کاراکتر گویند. در متون دست نوشت، به واسطه لرزش یا حرکت ناخواسته دست نویسنده در هنگام نگارش، ممکن است که کانتور حروف ناصاف شود.روشهاي هموارسازي كانتور بمنظور جبران اين نقيصه مورد استفاده قرار ميگيرند. بطور كلي هموارسازي كانتور تعداد نقاط نمونة مورد نياز براي بازنمايي كاراكتر را كاهش ميدهد و در نتيجه كارايي مراحل پردازشي باقيمانده را بهبود مي بخشد.نرماليزه كردن داده ها23

اسلاید 24: فشرده سازيتكنيك های متعارف فشرده سازي: باينري (دوسطحي) كردن تصوير متن نازك سازيتحليل بخشهاي مختلف پیش پردازش24

اسلاید 25: باينري (دوسطحي) كردن تصوير متنتصاویر دیجیتال به یکی از سه صورت تصاویر رنگی، تصاویر خاکستري ( مشابه تصویر یک تلویزیون سیاه و سفید که رنگ تصویر به صورت سیاه و سفید و طیفی از رنگ هاي خاکستري ظاهر می شود ) و تصاویر دوگانی یا دو سطحی ( مشابه تصویر یک سند فکس شده که رنگ پیکسل هاي تصویر، تنها سیاه یا سفید است) می باشند.تکنیکهای فشرده سازي25

اسلاید 26: نازك سازياين عمل درحاليكه كاهش قابل ملاحظه اي در حجم داده ها ايجاد ميكند، اطلاعات شكلي كاراكتر را نيز استخراج مي نمايد. دو روش پايه براي نازكسازي عبارتند از : نازكسازي از طريق پيكسل : بصورت محلي و تكراري تصوير را مورد پردازش قرار مي دهد تا وقتي كه از تصوير كاراكتر تنها اسكلت آن به عرض يك پيكسل باقي بماند.نازكسازي بدون پيكسل : طي فرايند نازك سازي مقداري از اطلاعات سراسري دربارة كاراكتر را مورد استفاده قرار مي دهند.تکنیکهای فشرده سازي26

اسلاید 27: قطعه بندي ( جداسازي ) قطعه بندي عبارت است از روش هايي كه بخش هاي مختلفي همچون پاراگراف ها، جملات يا كلمات، و حروف را از تصوير سند استخراج مي نمايند. نقطه تمایز اصلی میان سیستم هاي OCR فارسی و لاتین براي متون چاپی، در مرحله قطعه بندي درونی نهفته است. قطعه بندي غلط كاراكترها ، عامل بسياري از خطاهاي OCR است بخشهاي مختلف يك سيستم OCR 27

اسلاید 28: استخراج ویژگي ها (بازنمایي)این مرحله یکی از مراحل بسیار با اهمیت در سیستم هاي OCR است؛ چرا که نتایج حاصل از این مرحله، مستقیما بروي کیفیت مرحله بازشناسی اثر می گذارد. در مرحله بازنمایی، به هر الگوي ورودي یک کد یا بردار ویژگی نسبت داده می شود که معرف آن الگو در فضاي ویژگی ها است و آن را از دیگر الگوها متمایز می سازد.بخشهاي مختلف يك سيستم OCR 28

اسلاید 29: طبقه بندي یا بازشناسياین مرحله شامل روش هاي براي متناظر ساختن هر یک از الگوهاي بدست آمده از مرحله استخراج ویژگی ها، با یکی از کلاس هاي فضاي الگو مورد بحث است که از طریق کمینه ساختن فاصله بردار ویژگی هاي هر الگوي ورودي نسبت به یکی از بردارهاي مرجع انجام می گیرد.بخشهاي مختلف يك سيستم OCR 29

اسلاید 30: بكارگیري اطلاعات جانبي( پس پردازش) در این مرحله با استفاده از اطلاعات جانبی ( نظیر مجموعه لغات معتبر، اطلاعات آماري مربوط به رخداد حروف، اطلاعات دستوري و معنایی ) سعی در بهبود نتایج حاصل از مرحله بازشناسی می گردد. درصورت فراهم شدن اطلاعات معناشناختی، دقت نتایج بازشناسی به نحو چشمگیري افزایش می یابد.بخشهاي مختلف يك سيستم OCR 30

اسلاید 31: الگوریتم جداسازی و شناسایی حروف تایپی31

اسلاید 32: جداسازی سطرها متداولترین الگوریتمی که تا کنون براي جداسازي سطرهاي متن ارائه شده است از نماي عمودي تصویر متن بهره می گیرد.در این الگوریتم ابتدا نماي عمودي یک صفحه از متن رسم میگردد. نقاط مینیمم این نمودار ، مشخص کننده محل جداسازي سطرها از یکدیگر هستند . در حالت هایی که تصویر متن کاملا افقی و یا نزدیکتر به افقی باشد. ، این الگوریتم به خوبی کار میکند ، اما در حالت هایی که تصویر متن چرخیده باشد این الگوریتم قادر نخواهد بود سطرهاي متن را ازیکدیگر جدا کند32

اسلاید 33: نحوه جداسازی سطرهای متن به کمک نمای عمودی 33

اسلاید 34: جداسازی کلمات براي جداسازي کلمات هر سطر عموما از نماي افقی سطر استفاده شده است. در این روش ابتدا نماي افقی یک سطر از متن رسم میگردد . نقاطی که ارتفاع نماي افقی در آنها از یک مقدارآستانه اي کمتر باشد ، به عنوان محل جداسازي کلمات تلقی می شوند.34

اسلاید 35: این روش الزاما کلمات را از یکدیگر جدا نمیکند بلکه اجزایی را جدا میکند که در امتداد عمودي یکدیگر را نپوشانده باشند. هریک از این اجزا ممکن است یک کلمه کامل یا بخشی از یک کلمه باشد. 35

اسلاید 36: جداسازی حروفبراي شناسایی حروف تشکیل دهنده زیر کلمات باید ابتدا آنها را از یکدیگر جدا کنیم . الگوریتم جداسازي حروف الفباي فارسی دو وظیفه بر عهده دارد :الف) جداسازي حروفی که به حرف ما بعد خود نمی چسبند اما با آن همپوشانی دارند.ب) جداسازي حروفی که به حرف ما بعد خود می چسبند.36

اسلاید 37: كاربردهاي OCRجـداکردن نامه ها در مراکز پستدسته بندی چکهای بانک37

اسلاید 38: ارتباط بین انسان و ماشین با استفاده از خودکارتبدیل کتاب‌ها یا اسناد اسکن شده به فایل‌های متنی و تصاویر38

اسلاید 39: تبدیل حروف و نوشته های خطی، به خط بریل (مخصوص نابینایان) دانست و به این ترتیب همه نوشته های بشر توسط نابینایان قابل خوانده شدن است.کمک به خواندن افراد نابینا39

اسلاید 40: نتیجه گیریتسهیل در روند کاری در وقت و هزینه را در اداره و سازمان ها با سرعت بیشتر پیش می رود.افزایش چشمگیر سرعت دسترسی به اطلاعات؛کاهش فضاي ذخیره سازي40

اسلاید 41: منابعپایان نامه باز خوانی نوری حروف OCR(موسی غریبی)پردازش تصویر و معرفی تکنیک های استفاده از آن (حسن جباری و امین ثابت قدم اصل)41

34,000 تومان

خرید پاورپوینت توسط کلیه کارت‌های شتاب امکان‌پذیر است و بلافاصله پس از خرید، لینک دانلود پاورپوینت در اختیار شما قرار خواهد گرفت.

در صورت عدم رضایت سفارش برگشت و وجه به حساب شما برگشت داده خواهد شد.

در صورت بروز هر گونه مشکل به شماره 09353405883 در ایتا پیام دهید یا با ای دی poshtibani_ppt_ir در تلگرام ارتباط بگیرید.

افزودن به سبد خرید