مقاله پردازش تصویر مربوطه به صورت فایل ورد word و قابل ویرایش می باشد و دارای ۳۹ صفحه است . بلافاصله بعد از پرداخت و خرید لینک دانلود مقاله پردازش تصویر نمایش داده می شود، علاوه بر آن لینک مقاله مربوطه به ایمیل شما نیز ارسال می گردد
چکیده ۱
فصل اول: مقدمه
۱-۱:آشنایی با OCR ۲
۲-۱: پردازش تصاویر ماهواره ۳
۳-۱: پردازش تصویر در صنعت و پزشکی: ۳
فصل دوم: مراحل OCR
۲-۱: سیستمهای بازشناسی حروف ۵
۲-۲: اسکن کردن صفحات ۷
۲-۳: استخراج نواحی شامل متن و تفکیک متن به حروف ۷
۲-۴: شناسایی حروف ۹
۲-۵: ارائه نتایج ۱۰
فصل سوم: شبکه های عصبی
۳-۱: شبکه های عصبی ۱۱
۳-۲ آشنایی با شبکه عصبی ۱۱
۳-۳ انواع شبکه های عصبی ۱۲
۳-۴ نرون ۱۳
۳-۵ شبکه های Multilayer Perceptron و الگوریتم Backpropagation ۱۴
۳-۶Overlearning ۱۵
فصل چهارم: شرح یک پروژه انجام شده
۴-۱: شرح پروژه ۱۸
۴-۲: تصاویر مورد استفاده ۱۸
۴-۳: تبدیل تصاویر به بردارهای ویژگی ۱۹
۴-۴: آموزش شبکه عصبی ۲۰
۴-۵: طراحی ابتدایی ۲۱
۴-۶: تغییرات و سادهسازیها ۲۲
فصل پنجم: ویژگیهای متون فارسی
۵-۱: خصوصیات متون فارسی ۲۴
فصل ششم: برسی چند محصول OCR
۶-۱: چند نمونه OCR ۲۶
۶-۲: آموزش Readiris Pro ۱۱ ۲۶
۶-۳: آموزش VajehShenas V 1 ۲۸
۶-۴ مقایسه VajehShenasبا Readiris ۳۱
فصل هفتم: نتایج و پیشنهادات
۷-۱ نتیجهگیری ۳۲
مراجع ۳۴
]۱[ امید یگانه، مونا. ” جداسازی حروف تاییی مستقل از نوع فونت و اندازه “. پایان نامه کارشناسی ارشد، دانشکده مهندسی برق، دانشگاه صنعتی شریف، ۱۳۸۳٫
]۲[ اندیشه نرم افزار پایا، شرکت. “راهنمای بانک اطلاعاتی حدف۸۴” ۱۳۸۴٫
]۳[ بهنام قادر، احسان.” تشخیص کاراکترهای پلاکهای خودرو” پایاننامه کارشناسی، دانشکده مهندسی برق، دانشگاه صنعتی شریف، ۱۳۸۳٫
[۴] J Beeman. Dave. “Mululti-layer perceptrons (Feed-forward Nets),Gradient Descent, and back Propagation.. University of Colorado,2001 .
[۵]J Burrow, Peter. “Arabic Handwriting Recognition”.Master of Science Thesis, school of informatics, University of Edinburgh, 2004′
[۶] Gonzalez, Rafael C”, Woods, Richard E. Digital lmage Processing”. Second Editicn, New Jersey: Prentice-Hall, 2012.
[۷]Johnston. Atexander. “Classifying Persian Characters with Artificial Neural Networks and inverted Complex Zernike Moments”. 2005.
[۸] Klassen, Tim. “Towards Neurat Network Recognition of Handwrritten Arabic Letters”. A’project Submitted to the Faculty of Computer Science in Partial Fulfillment of the Requirerments for the Degree of Master of Computer Scinece Dalhousie University, 2001.
[۹] Math works lnc. *MATLAB Help”. MATLAB Version 7.0 (R14) Decurnentation.
[۱۰] Sarlewarren S, ‘Archive of Neural Network FAQ’. 2002
[۱۱]Dtat Soft Inc. “Neural Networks’. 20O3.
[۱۲]. Philippides, Andy.”mullti-Layer Perceptron (MLP)”. Netral Networks Lectures,2003
پردازش و آنالیز تصاویر می تواند به عنوان یک ساختار کاربردی و تکنیکی جهت تسخیرکردن، تصحیح کردن، زیاد کردن و تغییر شکل دادن تصاویری که مشاهده می شود تعریف کرد. در هنگام استفاده از تکنولوژی OCR، نرمافزار مربوطه تصویر را تجزیه وتحلیل می نماید و شکل حروف را بر اساس پراکندگی نقاط در تصویر، شناسایی می کند. متون می توانندحتی دارای عکس هم باشند که سیستم آنها را تشخیص داده، کنار می گذارد. یک سیستم OCR به ما این امکان را می دهد که یک کتاب و یا یک مقاله را مستقیما به یک فایل الکترونیکی تبدیل نماییم و آن را با کمک یک پرد ازشگر تغییر دهیم . استفاده از سیستم OCR یک راه کارآمد برای تبدیل متون به فایلهای داده است که ممکن است تایپ کردن آنها زمان زیادی به طول بیانجامد.این تکنولوژی مدتهاست که به وسیله کتابخانه ها و سازمان های دولتی برای دستیابی الکترونیکی سریع به مدارک حجیم به کار می رود و از لحاظ سرعت و هزینه روش مناسبی است. OCR از معدود زمینه های هوش مصنوعی است که میتوان در عمل به آن تکیه کرد . از متداولترین کاربردهای این تکنولوژی می توان جداکردن نامه ها در مراکز پست، دسته بندی چکها بانک، تبدیل متن به صدا برای استفاده نابینایان، امکان دسترسی سریع به بایگانیهای عظیم و تبدیل کتابهای قدیمی کتابخانه های به فرمتی مناسب برای ذخیره در کامییوتر را نام برد. هدف از این عملیات زیاد کردن کیفیت نسبی اطلاعاتی است که بعداً استخراج خواهد شد . تغییر شکل در حقیقت عملیاتی است که بر روی تصاویر ورو دی انجام میگیرد تا خروجی به یک عدد که اطلاعاتی از تصویر است بدهد . تکنیکهای متفاوت تولید تصاویر در دسترس می باشد با وجود این تکنیکهای پردازش اطلاعات به عملیات گستردهای اطلاق میشود که می تواند بر روی اشکال و فرمتهای مختلف تصاویر عمل کند.
ابتدا تصاویر جهت از بین بردن اعوجاجی که در مرحله جمعآوری تصاویر ایجاد میشوند تشخیص میگردند و تصحیح سپس پردازش تصاویر یک عملیاتی است که یک سری کاربردها را ارجحیت میبخشد. تکنیکهای جدید یا پروسه های جدید که جهت حل مسائل مشخص وجود دارند از میان کاربردهای مختلف انتخاب می شوند. پردازش تصاویر در سطوح مختلف انجمن های مدرن انجام میگیرد. روشها و تکنیکها در همه این سطوح به یک شکل میباشد و روشهایی که در مقوله مراقبت سلامتی انجام می گیرند از سایر روشهای پردازش تصاویر که در علوم مختلف و صنعت انجام میگیرد اقتباس میشوند. جهت توضیح دادن عمومیت پردازش تصاویر، تعدادی ازکاربرهای پزشکی و غیر پزشکی در زیر آمده شده است.
تصاویر زمین و سایر سطوح جهانی توسط دوربینهایی که برروی سفینههای فضایی و ماهوارهها نصب شده گرفته می شود . هنگامی که از سیارات دیگر تصویر گرف ته می شود، هدف مطالعه سطوح آنها جهت بدست آوردن آگاهی درباره تاریخچه و مشخصات آن میباشد. شبیه سازی ماهواره ای زمین جهت کارهایی از قبیل کارهای فلاحتی- زراعتی، هواشناسی، محیط اطراف، پردازشهای نظامی در بین سایر موارد می باشد.
تصاویر بخشهایی از سطوح زمین جهت کاهش تصویر و کوچکترکردن، بازرسی و یا جهت نقشهکشی گرفته میشود.
· چاپ کردن و دست نوشته ها:
تشخیص کاراکترهای چاپ یا نوشته شده از کاربردهای جدید پردازش تصاویر است . در بین کاربردهای دیگر می توان به خواندن اتوماتیک کدهای پستی و کدهای بانکی اشاره کرد.
· بارکد:
مسئول وارسی در بیشتر سوپرمارکتها دارای وسایلی هستند که بارکد موجود بر روی کالاها را خوانده و تفسیر میکند . از استفاده های بارکد می توان به نمونه های مدارک، نمونه های بیوشیمیایی و نمونه بافت در بیمارستان اشاره کرد.
· رادیولوژی:
در مبحث پزشکی، رادیولوژی یکی از کاربردهای اصلی تکنیک پردازش تصاویر است. کاربردهای آن نه تنها در اشعه x می باشد بلکه کاربردهایی از قبیل مقطع بندی کامپیوتری PET,MRI,CT ultra sound تمام نتایج به صورت تصاویر هستند که باید بعداً,تفسیر شوند. در میان این کاربردها، بازسازی سه بعدی تصاویر یکی ازموضوعهای مورد علاقه است.
· مجموعه خصوصیات کروموزومی موجودات:
از آنجا که تصاویر کروموزومی یکی از ساختارهای ساده میباشد، جفت شدگی کروموزومی و بازسازی خودکار آنها یکی از جدیدترین کاربردهای پردازش تصویر در پزشکی است.
· سلول شناسی و بافت شناسی:
تفسیر اتوماتیک و کوانتیزۀ تصاویر میکروسکوپیک از کاربردهای دیگر پردازش تصاویر در پزشکی است.
در این فصل، پس از ذکر تاریخچهای از OCR، مراحل تبدیل تصویر به متن را شرح د اده و ورودی و خروجی هر مرحله را بیان میکنیم.
· تاریخچه OCR
مبحث بازشناسی متون، همانند مبحث تشخیص صحبت از اوایل ظهور مبحث شناسایی الگو مطرح بود . در ابتدا شناسایی آنها آسان به نظر میرسید ولی در عمل بر خلاف انتظار بعد از یکسری پیشرفت کوچک، این مسأله با مشکلات بزرگی روبرو شد و توجه محققین به سمت سایر زمینههای شناخت الگو معطوف گشت . با پیدایش وسایل ارتباط جمعی الکترونیکی، نیاز شدیدی به سیستمهایی احساس شده است میشد که بتوانند با دقت و سرعت، اطلاعات نوشتاری موجود را خوانده و ذخیره نمایند. در سال۱۹۲۹ Taushech در آلمان و در سال ۱۹۳۳Handle در آمریکا ابداعاتی در زمینه OCR ثبت نمودند . اینها اولین ایدههای شناسایی حروف هستند . این روش، تطبیق الگو نام دارد و به این صورت کار میکند که به هر حرف، نور تابیده میشود و نور باز تابیده شده از حروف، از قالبهای مکانیکی عبور داده میشود . هرگاه که نوری از قالب عبور نکرد، حرف تشخیص داده میشود. در عمل تا زمان به عرصه آمدن کامپیوتر یعنی سال ۱۹۵۰ سیستم مطلوبی ساخته نشد. اولین کامپیوترتجاری ا UNIVAC درسال ۱۹۵۱ در آمریکا شروع به کار کرد در این زمان بود که ایده OCR به عنوان یک پدیده قابل پیاده ساز ی پذیرفته شد . از این زمان به بعد تحقیقات گستردهای بر رو ی این تکنولوژی انجام گرفته است و در نتیجه سیستمهای تجاری عرضه شدهاند که دارای قابلیتهای خوبی هستند. سیستمهای تجاری عرضه شده را می تواند به سه نسل تقسیمبندی نمود. سیستمهای نسل اول در اویل دهه ۱۹۶۰ به بازار آمدند که نتیجه تحقیقات دهه ۱۹۵۰ بودند. آنها فقط قابلیت تشخیص کاراکترهای خاص با اندازه و فونت مشخصی را داشتند . در آنها از روشهایی استفاده شده بود که نسبت به تغییر جای کاراکترها، اندازه و دوران آنها فوق العاده حساس بودند. شاخصترین سیستم این نسل، NCR 420 بود که میتوانست اعداد و پنج نماد دیگر را تشخیص دهد. سیستمهای نسل دوم در اواسط دهه ۱۹۶۰ به بازار آمدند و میتوانستند بعضی از کاراکترهای دستنویس مانند اعداد را تشخیص دهند. RETINA یکی از این سیستمها بود.
سیستمهای نسل سوم مربوط به اواخر دهه ۱۹۶۰ هستند که باهدف تشخیص کاراکترهایی باکیفیت چاپ پایین و همچنین متون دست نویس لاتین ساخته شدند . این نسل تا به امروزهم ادامه دارد و فعالیتهای گستردهای در این زمینه در حال انجام است. امروزه سیستمهای OCR قادر به تشخیص دقیق کاراکترهای تایپی لاتین با انواع فونتها و در اندازههای متفاوت هستند (تا۹۹%) ولی هنوز در مورد تشخیص متون دستنویس لاتین و یا فونتهایی که در آنها از خطوط خمیده استفاده می شود (مثل فارسی و عربی) مشکلات زیادی وجود دارد.
روشهای بسیاری تا به امروز برای شناسایی متون فارسی و عربی به کار رفتهاند . در سال ۱۳۵۹ به دنبال ابداع سیستمی برای شناسایی دست نوشتههای عربی موسوم به IRAC توجهات به این زمینه نوین در قلمرو بازشناسی الگو معطوف شد. به دنبال آن سیستم دیگری برای تشخیص کلمات تایپ شده عربی پیشنهاد شد که در آن ابتدا کلمات به حروف تفکیک شده و سپس توصیف کنندههای فوریه دوره خارجی حروف، مبنای شناسایی آنها قرار می گرفتند . به موازات آن دو روش ساختاری مطرح شدند.
· یکی مبتنی بر ایده دنبال کردن کانتور برای شناسایی حروف مجزای عربی و دیگری بر اساس استفاده از محلهای تقاطع و انشعاب پاره خطها برای شکستن کلمات به زیر حرفها و دسته بندی آنها به کمک ویژگیهای هندسی و توپولوژیکی.
در سال ۱۳۶۰ روشی برای شناسایی فونتهای بزرگ فارسی ابداع شد که از ویژگیهایی نظیر وجود حفره و دهنه برای شناسایی حروف بهره میجست . در سال ۱۳۷۲ دو سیستم جهت شناسایی حروف در متن فارسی تایپی ارائه گردید که یکی با روش شکلشناسی و دیگری بر اساس توصیفکنندههای فوریه عمل می نمود . امروزه با کمک شبکههای عصبی که قادرند ارتباط پیچیدهای بین ورودی و خروجی برقرار کنند، میتوان حروف فارسی را شناسایی نمود . مرجع {۷}
شامل پیوندهایی به چند پایان نامه انجام شده در زمینه OCRاست. مرجع {۸}نیز برخی پایاننامهها را بررسی و نتایج آنها را مقایسه نموده است. پس از ذکر این تاریخچه، به شرح مراحل مختلفOCR میپردازیم.
اسکن کردن، اولین مرحله کار یک سیستم OCR است. یک پرتو نور به صفحه مورد نظر تابیده میشود . با حرکت این پرتو روی صفحه و با تغییر مقدار سیاهی (و یا رنگ در اسکنرهای رنگی) شدت نور بازتابیده شده تغییر می کند . نور بازتابیده شده به آرایهای از سلولهای فتوالکتردیک برخورد کرده و به این ترتیب، یک فایل تصویری از صفحه اسکن شده بدست میآید. از آنجایی که با دیدن این تصاویر میتوانیم محتویات صفحه را دریابیم، ممکن است این سوال ییش آید که چرا باید زمان وهزینه تبدیل تصویر به متن را تقبل کنیم؟ در پاسخ باید گفت:
· حجم فایلهای تصویری بسیار بیشتر از فایلهای متن است، حتی اگر از روشهای فشردهسازی استفاده کنیم.
· تغییر در نحوه نمایش فایلهای تصویری مشکل و یا عملاً غیرممکن است، مثلاً تغییر فونت، در صورت امکان بسیار مشکل خواهد بود و یا ریز و درشت کردن تصویر میتواند به ناخوانا شدن حروف بیانجامد.
· تبدیل تصویر به اشکال دیگر ارائه، مثلاً خواند متن برای نابینایان، بسیار مشکل است.
· امکان جستجوی عبارتی خاص و یا مقایسه بخشهایی از متن تصویری با متون دیگر عملاً وجود ندارد.
مجموعه علتهای بالا باعث شده تا تلاشهای بسیاری برای تبدیل تصاویر به متن صورت گیرد . روشهای دیگری، از جمله استفاده از دوربین دیجیتال، نیز برای ایجاد فایلهای تصویری وجود دارد . این روشها معمولاً در زمینههای دیگر تشخیص الگو (مثل تشخیص چهره) بکار میروند.
در مورد تبدیل متون کتابها و سایر نوشتهها، اسکن کردن مناسب ترین روش است . البته در بعض ی کاربردها (مثل LPR) استفاده از این دوربینها ضروری است.
یک فایل تصویری اسکن شده، فقط شامل متن نیست بلکه ممکن است شامل تصویر اشخاص و مناظر، نمودار و سایر تصاویر غیر متنی نیز باشد. سیستم OCR باید بتواند نواحی شامل متن را شناسایی و استخراج کند.
الف) اگر چیدمان صفحه اسکن شده مشخص باشد(مثل چک بانکی، پلاک خودرو، فرم ثبت نام داوطلبین آزمونها) این کار با روشی ساده و با قابلیت اطمینان بالا امکانپذیر است . مثلاً در شکل(۱-۲) با استفاده از موقعیت مکانی مستطیلهای سیاه کوچک حروف مورد نظر به سادگی استخراج میشوند.
ب) اما اگر چیدمان صفحه مشخص نباشد (مثل صفحات کتاب) باید از روشهای پیچیدهتری بهره گرفت که بتوانند بر اساس تفاوتهای تصاویر متنی با تصاویر اشخاص و مناظر ، متن را استخراج کنند. بدیهی است که در این کار امکان خطا وجود دارد. یکی از روشهای مورد استفاده در این حالت، استفاده از هیستوگرام (histogram ) است. تصاویر متنی معمولاً هیستوگرام حول دو رنگ (نوشته و زمینه) مقدار بالا دارند ولی تصاویر غیرمتنی در بسیاری از رنگها، مؤلفه دارند . برای کسب اطلاعات بیشتر در مورد روشهای استخراج نواحی متنی میتوانید به (۱) مراجعه کنید.
تصاویر متن پس از استخراج، بر اساس یک آستانه که توسط روشهای آماری بدست میآید ({۱}،{۹}) به تصاویر سیاه و سفید (باینری) تبدیل شده و توسط فیلترهای مثل Median و LP نویزگیری میشوند{۶}.
اگر سیستم OCR بخواهد خروجی مشابه با ورودی بدهد (مثلاً در تبدیل کتابها که خروجی از لحاظ بصری شبیه صفحه اسکن شده است) باید چیدمان صفحه اسکن شده را ذخیره کند . درسیستمهای دیگر(مثل سیستمهایی که خروجی آنها صوتی است یا سیستمهای LPR) این کار لزومی ندارد. پس از انجام این مرحله، متون استخراج شده باید به تعداد محدودی واحد”قابل تشخیص اتوماتیک “تفکیک شوند . معمولاً این واحدها حروف تشکیل دهنده متن هستند، هرچند در برخی الگوریتمها از زیرواژهها (مثل”با”و”لا”در کلمه”بالا”)به عنوان واحد تشخیص استفاده میشود.
در برخی از کا ربردها مثل فرم آزمونها (شکل(۲-۱) دو مرحله استخراج نواحی و تفکیک به حروف، مستقیماً انجام می شود ولی در سایر کاربردها باید از الگوریتمها ی ویژهای استفاده کرد . این کار درمورد حروف چاپی لاتین نسبتاً ساده است زیرا حروف به صورت مجزا در کنارهم قرار میگیرند و بین آنها فاصله خالی وجود دارد . در مورد متون فارسی و سایر زبانهایی که به صورت”سرهم “نوشته میشوند باید کارهای پیچیدهتری صورت گیرد. (به عنوان یک مرجع خوب در این مورد به {۱} مراجعه کنید).
در صورت انجام موفق این مرحله، مجموعهای از تصاویر بدست می آید که هر تصویر شامل یک حرف است. این تصاو یر بعنوان ورودی به نرمافزار شناسایی کننده حروف داده می شوند . بسیار ی از الگوریتمها تصویر رنگی یا خاکستری را نیز برای استفاده درپردازشها ذخیره میکنند.
تمام مقالات و پایان نامه و پروژه ها به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد.
جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر