مقاله پردازش تصویر

مقاله پردازش تصویر

دسته: رشته الکترونیک, رشته برق

فرمت : word | حجم : 1.2mb | صفحات : 39

قیمت: 4000 تومان
3,647 بازدید

مقاله پردازش تصویر مربوطه به صورت فایل ورد word و قابل ویرایش می باشد و دارای ۳۹ صفحه است . بلافاصله بعد از پرداخت و خرید لینک دانلود مقاله پردازش تصویر نمایش داده می شود، علاوه بر آن لینک مقاله مربوطه به ایمیل شما نیز ارسال می گردد

فهرست

چکیده   ۱
فصل اول: مقدمه
۱-۱:آشنایی با OCR   ۲
۲-۱: پردازش تصاویر ماهواره   ۳
۳-۱: پردازش تصویر در صنعت و پزشکی:   ۳
فصل دوم: مراحل OCR
۲-۱: سیستمهای بازشناسی حروف   ۵
۲-۲: اسکن کردن صفحات   ۷
۲-۳: استخراج نواحی شامل متن و تفکیک متن به حروف   ۷
۲-۴: شناسایی حروف   ۹
۲-۵: ارائه نتایج   ۱۰
فصل سوم: شبکه های عصبی
۳-۱: شبکه های عصبی   ۱۱
۳-۲ آشنایی با شبکه عصبی   ۱۱
۳-۳ انواع شبکه های عصبی   ۱۲
۳-۴ نرون   ۱۳
۳-۵ شبکه های Multilayer Perceptron و الگوریتم Backpropagation   ۱۴
۳-۶Overlearning   ۱۵
فصل چهارم: شرح یک پروژه انجام شده
۴-۱: شرح پروژه   ۱۸
۴-۲: تصاویر مورد استفاده   ۱۸
۴-۳: تبدیل تصاویر به بردارهای ویژگی   ۱۹
۴-۴: آموزش شبکه عصبی   ۲۰
۴-۵: طراحی ابتدایی   ۲۱
۴-۶: تغییرات و سادهسازیها   ۲۲
فصل پنجم: ویژگیهای متون فارسی
۵-۱: خصوصیات متون فارسی   ۲۴
فصل ششم: برسی چند محصول OCR
۶-۱: چند نمونه OCR   ۲۶
۶-۲: آموزش Readiris Pro ۱۱   ۲۶
۶-۳: آموزش VajehShenas V 1   ۲۸
۶-۴ مقایسه VajehShenasبا Readiris   ۳۱
فصل هفتم: نتایج و پیشنهادات
۷-۱ نتیجه‌گیری   ۳۲
مراجع   ۳۴

مراجع

]۱[ امید یگانه، مونا. ” جداسازی حروف تاییی مستقل از نوع فونت و اندازه “. پایان نامه کارشناسی ارشد، دانشکده مهندسی برق، دانشگاه صنعتی شریف، ۱۳۸۳٫

]۲[ اندیشه نرم افزار پایا، شرکت. “راهنمای بانک اطلاعاتی حدف۸۴” ۱۳۸۴٫

]۳[ بهنام قادر، احسان.” تشخیص کاراکترهای پلاکهای خودرو” پایان‌نامه کارشناسی، دانشکده مهندسی برق، دانشگاه صنعتی شریف، ۱۳۸۳٫

[۴] J Beeman. Dave. “Mululti-layer perceptrons (Feed-forward Nets),Gradient Descent, and back Propagation.. University of Colorado,2001 .

[۵]J Burrow, Peter. “Arabic Handwriting Recognition”.Master of Science Thesis, school of informatics, University of Edinburgh, 2004′

[۶] Gonzalez, Rafael C”, Woods, Richard E. Digital lmage Processing”. Second Editicn, New Jersey: Prentice-Hall, 2012.

[۷]Johnston. Atexander. “Classifying Persian Characters with Artificial Neural Networks and inverted Complex Zernike Moments”. 2005.

[۸] Klassen, Tim. “Towards Neurat Network Recognition of Handwrritten Arabic Letters”. A’project Submitted to the Faculty of Computer Science in Partial Fulfillment of the Requirerments for the Degree of Master of Computer Scinece Dalhousie University, 2001.

[۹] Math works lnc. *MATLAB Help”. MATLAB Version 7.0 (R14) Decurnentation.

[۱۰] Sarlewarren S, ‘Archive of Neural Network FAQ’. 2002

[۱۱]Dtat Soft Inc. “Neural Networks’. 20O3.

[۱۲]. Philippides, Andy.”mullti-Layer Perceptron (MLP)”. Netral Networks Lectures,2003

۱-۱:آشنایی با OCR

پردازش و آنالیز تصاویر می تواند به عنوان یک ساختار کاربردی و تکنیکی جهت تسخیرکردن، تصحیح کردن، زیاد کردن و تغییر شکل دادن تصاویری که مشاهده می شود تعریف کرد. در هنگام استفاده از تکنولوژی OCR، نرم‌افزار مربوطه تصویر را تجزیه وتحلیل می نماید و شکل حروف را بر اساس پراکندگی نقاط در تصویر، شناسایی می کند. متون می توانندحتی دارای عکس هم باشند که سیستم آنها را تشخیص داده، کنار می گذارد. یک سیستم OCR به ما این امکان را می دهد که یک کتاب و یا یک مقاله را مستقیما به یک فایل الکترونیکی تبدیل نماییم و آن را با کمک یک پرد ازشگر تغییر دهیم . استفاده از سیستم OCR یک راه کارآمد برای تبدیل متون به فایلهای داده است که ممکن است تایپ کردن آنها زمان زیادی به طول بیانجامد.این تکنولوژی مدتهاست که به وسیله کتابخانه ها و سازمان های دولتی برای دستیابی الکترونیکی سریع به مدارک حجیم به کار می رود و از لحاظ سرعت و هزینه روش مناسبی است. OCR از معدود زمینه های هوش مصنوعی است که می‌توان در عمل به آن تکیه کرد . از متداول‌ترین کاربردهای این تکنولوژی می توان جداکردن نامه ها در مراکز پست، دسته بندی چکها بانک، تبدیل متن به صدا برای استفاده نابینایان، امکان دسترسی سریع به بایگانیهای عظیم و تبدیل کتابهای قدیمی کتابخانه های به فرمتی مناسب برای ذخیره در کامییوتر را نام برد. هدف از این عملیات زیاد کردن کیفیت نسبی اطلاعاتی است که بعداً استخراج خواهد شد . تغییر شکل در حقیقت عملیاتی است که بر روی تصاویر ورو دی انجام می‌گیرد تا خروجی به یک عدد که اطلاعاتی از تصویر است بدهد . تکنیکهای متفاوت تولید تصاویر در دسترس می باشد با وجود این تکنیکهای پردازش اطلاعات به عملیات گسترده‌ای اطلاق می‌شود که می تواند بر روی اشکال و فرمتهای مختلف تصاویر عمل کند.

ابتدا تصاویر جهت از بین بردن اعوجاجی که در مرحله جمع‌آوری تصاویر ایجاد می‌شوند تشخیص می‌گردند و تصحیح سپس پردازش تصاویر یک عملیاتی است که یک سری کاربردها را ارجحیت می‌بخشد. تکنیکهای جدید یا پروسه های جدید که جهت حل مسائل مشخص وجود دارند از میان کاربردهای مختلف انتخاب می شوند. پردازش تصاویر در سطوح مختلف انجمن های مدرن انجام می‌گیرد. روشها و تکنیکها در همه این سطوح به یک شکل می‌باشد و روشهایی که در مقوله مراقبت سلامتی انجام می گیرند از سایر روشهای پردازش تصاویر که در علوم مختلف و صنعت انجام می‌گیرد اقتباس می‌شوند. جهت توضیح دادن عمومیت پردازش تصاویر، تعدادی از‌کاربرهای پزشکی و غیر پزشکی در زیر آمده شده است.

۲-۱: پردازش تصاویر ماهواره

تصاویر زمین و سایر سطوح جهانی توسط دوربین‌هایی که برروی سفینه‌های فضایی و ماهواره‌ها نصب شده گرفته می شود . هنگامی که از سیارات دیگر تصویر گرف ته می شود، هدف مطالعه سطوح آنها جهت بدست آوردن آگاهی درباره تاریخچه و مشخصات آن می‌باشد. شبیه سازی ماهواره ای زمین جهت کارهایی از قبیل کارهای فلاحتی- زراعتی، هواشناسی، محیط اطراف، پردازشهای نظامی در بین سایر موارد می باشد.

۳-۱: پردازش تصویر در صنعت و پزشکی:

تصاویر بخشهایی از سطوح زمین جهت کاهش تصویر و کوچکترکردن، بازرسی و یا جهت نقشه‌کشی گرفته می‌شود.

· چاپ کردن و دست نوشته ها:

تشخیص کاراکترهای چاپ یا نوشته شده از کاربردهای جدید پردازش تصاویر است . در بین کاربردهای دیگر می توان به خواندن اتوماتیک کدهای پستی و کدهای بانکی اشاره کرد.

· بارکد:

مسئول وارسی در بیشتر سوپرمارکتها دارای وسایلی هستند که بارکد موجود بر روی کالاها را خوانده و تفسیر می‌کند . از استفاده های بارکد می توان به نمونه های مدارک، نمونه های بیوشیمیایی و نمونه بافت در بیمارستان اشاره کرد.

· رادیولوژی:

در مبحث پزشکی، رادیولوژی یکی از کاربردهای اصلی تکنیک پردازش تصاویر است. کاربردهای آن نه تنها در اشعه x می باشد بلکه کاربردهایی از قبیل مقطع بندی کامپیوتری PET,MRI,CT ultra sound تمام نتایج به صورت تصاویر هستند که باید بعداً,تفسیر شوند. در میان این کاربردها، بازسازی سه بعدی تصاویر یکی ازموضوعهای مورد علاقه است.

· مجموعه خصوصیات کروموزومی موجودات:

از آنجا که تصاویر کروموزومی یکی از ساختارهای ساده می‌باشد، جفت شدگی کروموزومی و بازسازی خودکار آنها یکی از جدیدترین کاربردهای پردازش تصویر در پزشکی است.

· سلول شناسی و بافت شناسی:

تفسیر اتوماتیک و کوانتیزۀ تصاویر میکروسکوپیک از کاربردهای دیگر پردازش تصاویر در پزشکی است.

فصل دوم:

مراحل OCR

۲-۱: سیستمهای بازشناسی حروف

در این فصل، پس از ذکر تاریخچه‌ای از OCR، مراحل تبدیل تصویر به متن را شرح د اده و ورودی و خروجی هر مرحله را بیان می‌کنیم.

· تاریخچه OCR

مبحث بازشناسی متون، همانند مبحث تشخیص صحبت از اوایل ظهور مبحث شناسایی الگو مطرح بود . در ابتدا شناسایی آنها آسان به نظر می‌رسید ولی در عمل بر خلاف انتظار بعد از یکسری پیشرفت کوچک، این مسأله با مشکلات بزرگی روبرو شد و توجه محققین به سمت سایر زمینه‌های شناخت الگو معطوف گشت . با پیدایش وسایل ارتباط جمعی الکترونیکی، نیاز شدیدی به سیستمهایی احساس شده است می‌شد که بتوانند با دقت و سرعت، اطلاعات نوشتاری موجود را خوانده و ذخیره نمایند. در سال۱۹۲۹ Taushech در آلمان و در سال ۱۹۳۳Handle در آمریکا ابداعاتی در زمینه OCR ثبت نمودند . اینها اولین ایده‌های شناسایی حروف هستند . این روش، تطبیق الگو نام دارد و به این صورت کار می‌کند که به هر حرف، نور تابیده می‌شود و نور باز تابیده شده از حروف، از قالب‌های مکانیکی عبور داده می‌شود . هرگاه که نوری از قالب عبور نکرد، حرف تشخیص داده می‌شود. در عمل تا زمان به عرصه آمدن کامپیوتر یعنی سال ۱۹۵۰ سیستم مطلوبی ساخته نشد. اولین کامپیوترتجاری ا UNIVAC درسال ۱۹۵۱ در آمریکا شروع به کار کرد در این زمان بود که ایده OCR به عنوان یک پدیده قابل پیاده ساز ی پذیرفته شد . از این زمان به بعد تحقیقات گسترده‌ای بر رو ی این تکنولوژی انجام گرفته است و در نتیجه سیستمهای تجاری عرضه شده‌اند که دارای قابلیت‌های خوبی هستند. سیستمهای تجاری عرضه شده را می تواند به سه نسل تقسیم‌بندی نمود. سیستمهای نسل اول در اویل دهه ۱۹۶۰ به بازار آمدند که نتیجه تحقیقات دهه ۱۹۵۰ بودند. آنها فقط قابلیت تشخیص کاراکترهای خاص با اندازه و فونت مشخصی را داشتند . در آنها از روشهایی استفاده شده بود که نسبت به تغییر جای کاراکترها، اندازه و دوران آنها فوق العاده حساس بودند. شاخص‌ترین سیستم این نسل، NCR 420 بود که می‌توانست اعداد و پنج نماد دیگر را تشخیص دهد. سیستمهای نسل دوم در اواسط دهه ۱۹۶۰ به بازار آمدند و می‌توانستند بعضی از کاراکترهای دست‌نویس مانند اعداد را تشخیص دهند. RETINA یکی از این سیستمها بود.

سیستمهای نسل سوم مربوط به اواخر دهه ۱۹۶۰ هستند که باهدف تشخیص کاراکترهایی باکیفیت چاپ پایین و همچنین متون دست نویس لاتین ساخته شدند . این نسل تا به امروزهم ادامه دارد و فعالیتهای گسترده‌ای در این زمینه در حال انجام است. امروزه سیستمهای OCR قادر به تشخیص دقیق کاراکترهای تایپی لاتین با انواع فونتها و در اندازه‌های متفاوت هستند (تا۹۹%) ولی هنوز در مورد تشخیص متون دست‌نویس لاتین و یا فونتهایی که در آنها از خطوط خمیده استفاده می شود (مثل فارسی و عربی) مشکلات زیادی وجود دارد.

روشهای بسیاری تا به امروز برای شناسایی متون فارسی و عربی به کار رفته‌اند . در سال ۱۳۵۹ به دنبال ابداع سیستمی برای شناسایی دست نوشته‌های عربی موسوم به IRAC توجهات به این زمینه نوین در قلمرو بازشناسی الگو معطوف شد. به دنبال آن سیستم دیگری برای تشخیص کلمات تایپ شده عربی پیشنهاد شد که در آن ابتدا کلمات به حروف تفکیک شده و سپس توصیف کننده‌های فوریه دوره خارجی حروف، مبنای شناسایی آنها قرار می گرفتند . به موازات آن دو روش ساختاری مطرح شدند.

· یکی مبتنی بر ایده دنبال کردن کانتور برای شناسایی حروف مجزای عربی و دیگری بر اساس استفاده از محله‌ای تقاطع و انشعاب پاره خطها برای شکستن کلمات به زیر حرفها و دسته بندی آنها به کمک ویژگیهای هندسی و توپولوژیکی.

در سال ۱۳۶۰ روشی برای شناسایی فونتهای بزرگ فارسی ابداع شد که از ویژگیهایی نظیر وجود حفره و دهنه برای شناسایی حروف بهره می‌جست . در سال ۱۳۷۲ دو سیستم جهت شناسایی حروف در متن فارسی تایپی ارائه گردید که یکی با روش شکل‌شناسی و دیگری بر اساس توصیف‌کننده‌های فوریه عمل می نمود . امروزه با کمک شبکه‌های عصبی که قادرند ارتباط پیچیده‌ای بین ورودی و خروجی برقرار کنند، می‌توان حروف فارسی را شناسایی نمود . مرجع {۷}

شامل پیوندهایی به چند پایان نامه انجام شده در زمینه OCRاست. مرجع {۸}نیز برخی پایان‌نامه‌ها را بررسی و نتایج آنها را مقایسه نموده است. پس از ذکر این تاریخچه، به شرح مراحل مختلفOCR می‌پردازیم.

۲-۲: اسکن کردن صفحات

اسکن کردن، اولین مرحله کار یک سیستم OCR است. یک پرتو نور به صفحه مورد نظر تابیده می‌شود . با حرکت این پرتو روی صفحه و با تغییر مقدار سیاهی (و یا رنگ در اسکنرهای رنگی) شدت نور بازتابیده شده تغییر می کند . نور بازتابیده شده به آرایه‌ای از سلول‌های فتوالکتردیک برخورد کرده و به این ترتیب، یک فایل تصویری از صفحه اسکن شده بدست می‌آید. از آنجایی که با دیدن این تصاویر می‌توانیم محتویات صفحه را دریابیم، ممکن است این سوال ییش آید که چرا باید زمان وهزینه تبدیل تصویر به متن را تقبل کنیم؟ در پاسخ باید گفت:

· حجم فایل‌های تصویری بسیار بیشتر از فایلهای متن است، حتی اگر از روشهای فشرده‌سازی استفاده کنیم.
· تغییر در نحوه نمایش فایلهای تصویری مشکل و یا عملاً غیرممکن است، مثلاً تغییر فونت، در صورت امکان بسیار مشکل خواهد بود و یا ریز و درشت کردن تصویر می‌تواند به ناخوانا شدن حروف بیانجامد.
· تبدیل تصویر به اشکال دیگر ارائه، مثلاً خواند متن برای نابینایان، بسیار مشکل است.
· امکان جستجوی عبارتی خاص و یا مقایسه بخشهایی از متن تصویری با متون دیگر عملاً وجود ندارد.

مجموعه علتهای بالا باعث شده تا تلاشهای بسیاری برای تبدیل تصاویر به متن صورت گیرد . روشهای دیگری، از جمله استفاده از دوربین دیجیتال، نیز برای ایجاد فایلهای تصویری وجود دارد . این روشها معمولاً در زمینه‌های دیگر تشخیص الگو (مثل تشخیص چهره) بکار می‌روند.

در مورد تبدیل متون کتابها و سایر نوشته‌ها، اسکن کردن مناسب ترین روش است . البته در بعض ی کاربردها (مثل LPR) استفاده از این دوربینها ضروری است.

۲-۳: استخراج نواحی شامل متن و تفکیک متن به حروف

یک فایل تصویری اسکن شده، فقط شامل متن نیست بلکه ممکن است شامل تصویر اشخاص و مناظر، نمودار و سایر تصاویر غیر متنی نیز باشد. سیستم OCR باید بتواند نواحی شامل متن را شناسایی و استخراج کند.

الف) اگر چیدمان صفحه اسکن شده مشخص باشد(مثل چک بانکی، پلاک خودرو، فرم ثبت نام داوطلبین آزمونها) این کار با روشی ساده و با قابلیت اطمینان بالا امکان‌پذیر است . مثلاً در شکل(۱-۲) با استفاده از موقعیت مکانی مستطیل‌های سیاه کوچک حروف مورد نظر به سادگی استخراج می‌شوند.

ب) اما اگر چیدمان صفحه مشخص نباشد (مثل صفحات کتاب) باید از روشهای پیچیده‌تری بهره گرفت که بتوانند بر اساس تفاوتهای تصاویر متنی با تصاویر اشخاص و مناظر ، متن را استخراج کنند. بدیهی است که در این کار امکان خطا وجود دارد. یکی از روشهای مورد استفاده در این حالت، استفاده از هیستوگرام (histogram ) است. تصاویر متنی معمولاً هیستوگرام حول دو رنگ (نوشته و زمینه) مقدار بالا دارند ولی تصاویر غیرمتنی در بسیاری از رنگها، مؤلفه دارند . برای کسب اطلاعات بیشتر در مورد روشهای استخراج نواحی متنی می‌توانید به (۱) مراجعه کنید.

تصاویر متن پس از استخراج، بر اساس یک آستانه که توسط روشهای آماری بدست می‌آید ({۱}،{۹}) به تصاویر سیاه و سفید (باینری) تبدیل شده و توسط فیلترهای مثل Median و LP نویزگیری می‌شوند{۶}.

اگر سیستم OCR بخواهد خروجی مشابه با ورودی بدهد (مثلاً در تبدیل کتابها که خروجی از لحاظ بصری شبیه صفحه اسکن شده است) باید چیدمان صفحه اسکن شده را ذخیره کند . درسیستمهای دیگر(مثل سیستمهایی که خروجی آنها صوتی است یا سیستمهای LPR) این کار لزومی ندارد. پس از انجام این مرحله، متون استخراج شده باید به تعداد محدودی واحد”قابل تشخیص اتوماتیک “تفکیک شوند . معمولاً این واحدها حروف تشکیل دهنده متن هستند، هرچند در برخی الگوریتمها از زیرواژه‌ها (مثل”با”و”لا”در کلمه”بالا”)به عنوان واحد تشخیص استفاده می‌شود.

در برخی از کا ربردها مثل فرم آزمونها (شکل(۲-۱) دو مرحله استخراج نواحی و تفکیک به حروف، مستقیماً انجام می شود ولی در سایر کاربردها باید از الگوریتمها ی ویژه‌ای استفاده کرد . این کار درمورد حروف چاپی لاتین نسبتاً ساده است زیرا حروف به صورت مجزا در کنارهم قرار می‌گیرند و بین آنها فاصله خالی وجود دارد . در مورد متون فارسی و سایر زبانهایی که به صورت”سرهم “نوشته می‌شوند باید کارهای پیچیده‌تری صورت گیرد. (به عنوان یک مرجع خوب در این مورد به {۱} مراجعه کنید).

در صورت انجام موفق این مرحله، مجموعه‌ای از تصاویر بدست می آید که هر تصویر شامل یک حرف است. این تصاو یر بعنوان ورودی به نرم‌افزار شناسایی کننده حروف داده می شوند . بسیار ی از الگوریتمها تصویر رنگی یا خاکستری را نیز برای استفاده درپردازشها ذخیره می‌کنند.

۲-۴: شناسایی حروف

تمام مقالات و پایان نامه و پروژه ها به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد.

جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی: