مقاله تصویر دیجیتال

مقاله تصویر دیجیتال

دسته: رشته کامپیوتر

فرمت : word | حجم : 4.1mb | صفحات : 138

قیمت: 12000 تومان
1,979 بازدید

مقاله تصویر دیجیتال مربوطه به صورت فایل ورد word و قابل ویرایش می باشد و دارای ۱۳۸ صفحه است . بلافاصله بعد از پرداخت و خرید لینک دانلود مقاله تصویر دیجیتال نمایش داده می شود، علاوه بر آن لینک مقاله مربوطه به ایمیل شما نیز ارسال می گردد

فهرست

فصل اول: ۱

مقدمه ای بر پردازش تصویر دیجیتال. ۱

۱-۱ : مقدمه. ۲

۱-۲ : مراحل اساسی پردازش تصویر. ۳

۱-۳ : یک مدل ساده تصویر. ۵

۴-۱: تشخیص صورت.. ۶

۱-۵ : تشخیص و تعبیر. ۸

فصل دوم : ۱۱

بررسی دقیق تر برخی از روش های معرفی شده توسط سایر محققین در زمینه تشخیص صورت.. ۱۱

۲-۱ : تشخیص صورت در تصاویر رنگی با استفاده از فیلتر پوست.. ۱۲

۱-۱-۲: چکیده. ۱۲

۲-۱-۲ : فیلتر پوست.. ۱۳

۲-۱-۳ : تشخیص صورت در نواحی پوست.. ۱۷

۲-۲ : الگوریتم تشخیص صورت بر مبنای مکان یابی ویژگی های صورت.. ۲۱

مقدمه. ۲۱

۲-۲-۱ : چکیده. ۲۲

۲-۲-۲ : الگوریتم تشخیص صورت.. ۲۲

۲-۲-۳ : جبران سازی نور و تشخیص رنگ و تن پوست.. ۲۳

۲-۲-۴ : مکان یابی ویژگی های مربوط به صورت.. ۲۴

۵-۲-۲ : نتایج.. ۲۷

۲-۳: یک متد آماری برای تشخیص اجسام سه بعدی.. ۲۸

مقدمه. ۲۸

۲-۳-۱ : چکیده. ۲۸

۲-۳-۲ : تشخیص بر مبنای ظاهر. ۲۹

۲-۳-۳ : قانون تصمیم آماری.. ۳۰

۲-۳-۳-۱ : احتمال بر اساس نتایج آماری.. ۳۱

۲-۳-۳-۲ : تجزیۀ ظاهر به فضا،فراوانی و جهت.. ۳۳

۲-۳-۳-۳ : نمایش نمونه ها با زیر مجموعۀ ضریب موج. ۳۴

۲-۳-۳-۴ : فرم نهایی تشخیص دهنده. ۳۷

۲-۳-۴ : جمع آوری آمار. ۳۷

۲-۳-۵ : کاربرد تشخص دهنده ها ۳۸

۲-۳-۶ : صحت تشخیص صورت با چرخش خارج از محدوده. ۳۹

۲-۴ : تشخیص صورت با استفاده از روش مسافت هاسدورف.. ۴۲

مقدمه: ۴۲

۲-۴-۱ : چکیده. ۴۲

۲-۴-۲ : تشخیص جسم با روش هاسدورف.. ۴۳

۲-۴-۲-۱ : تعریف.. ۴۳

۲-۴-۲-۲ : تشخیص بر پایۀ مدل. ۴۳

۲-۴-۳ : توضیح سیستم. ۴۴

۲-۴-۳-۱ : دوره تشخیص… ۴۵

۲-۴-۳-۲ : پالایش… ۴۵

۲-۴-۳-۳ : انتخاب مدل. ۴۶

۲-۴-۴ : صحت.. ۴۶

۲-۴-۵ : نتایج.. ۴۷

۲-۵ : مدل ژنتیک بهینه سازی مکان یابی چهره به روش هاسدورف بر پایه مسافت.. ۴۸

۲-۵-۱ : مقدمه. ۴۸

۲-۵-۲ : چکیده. ۴۹

۲-۵-۳ : تشخیص صورت با روش هاسدورف بر پایه مسافت.. ۴۹

۲-۵-۴ : مدل ژنتیک… ۵۲

-۵-۲۴-۱ : کد های مدل. ۵۲

۲-۵-۴-۲ : توابع تناسب.. ۵۲

۲-۵-۴-۳ : پارامتر های مورد نیاز. ۵۴

۲-۵-۴-۴ : مقداردهی اولیه. ۵۵

۲-۵-۵ : نتایج آزمایشات.. ۵۵

۲-۵-۶ : نتیجه گیری.. ۵۹

فصل سوم : ۶۰

تشخیص صورت بر مبنای رنگ پوست.. ۶۰

۳-۱ : استفاده از رنگ به عنوان ابزار پردازش تصاویر رنگی.. ۶۱

۳-۱-۱ : مبانی رنگ… ۶۲

۳-۲ : تشخیص پوست.. ۶۴

۳-۳ : مدل های رنگ… ۶۴

۳-۳-۱ : مدل رنگ RGB. 65

۳-۳-۲ : مدل رنگ CMY. 68

۳-۳-۳ : مدل رنگ YIQ.. 68

۳-۳-۴ : مدل رنگ HSI 69

۳-۳-۵ : مدل رنگ YCbCr 71

۳-۳-۵-۱: تبدیلات بین RGB و YCbCr 73

۳-۳-۶ : مدل های رنگ دیگر. ۷۵

۳-۳-۷ : نتیجه گیری از فضاهای رنگ… ۷۵

۳-۴ : ساختن مدل برای پوست.. ۷۶

فصل چهارم : ۷۸

شناسایی صورت در یک پایگاه داده اختیاری.. ۷۸

۴-۱ : شناسائی صورت.. ۷۹

۴-۱-۱ : مقدمه. ۷۹

۴-۱-۲ : تاریخچه. ۷۹

۴-۱-۳ : روش های برجسته. ۸۰

principle component analysis : 1-3-1-4. 81

: ۲-۳-۱-۴ Linear discriminant analysis. 81

-۳-۱-۴۳: Elastic Bunch Graph Matching. 82

۴-۱-۴ : ارزیابی دولت ایالات متحده امریکا ۸۳

۴-۱-۵ : نظر اجمالی به استاندارد ها ۸۵

:۶-۱-۴ نتیجه گیری.. ۸۵

۴-۲ : قرارداد فرت برای الگوریتم شناسایی صورت.. ۸۶

۴-۲-۱ : مقدمه. ۸۶

۴-۲-۲ : چکیده. ۸۶

۴-۲-۳ : تست سپتامبر ۹۶ فرت.. ۸۷

۴-۲-۴ : مدل تحقیق.. ۹۱

۴-۲-۵ : نتایج تحقیق.. ۹۳

۴-۲-۶ : نتیجه گیری.. ۹۹

فصل پنجم : ۱۰۱

روش انجام کار. ۱۰۱

۵-۱ : مقدمه. ۱۰۲

۵-۲ : مدل کردن رنگ پوست.. ۱۰۲

۵-۳ : جداسازی پوست.. ۱۰۶

۵-۴ : نواحی پوست.. ۱۰۹

۵-۴-۱ : یافتن تعداد سوراخ های یک ناحیه. ۱۱۰

۵-۴-۲ : مرکز حجم. ۱۱۱

۵-۴-۳ : جهت.. ۱۱۲

۵-۴-۴ : عرض و ارتفاع ناحیه. ۱۱۳

۵-۴-۵ : نسبت ناحیه. ۱۱۳

۵-۴-۶ : الگوی صورت.. ۱۱۳

۵-۵ : تطبیق الگو. ۱۱۴

۵-۶ راهکارهای پیشرفت این پروژه: ۱۱۹

۵-۷ نتایج : ۱۲۰

فهرست منابع. ۱۲۳

فهرست منابع

[۱]رافائل سی. گونزالس،‌ ریچارد ای. وودز، ترجمه دکتر مرتضی خادمی و مهندس داوود جعفری، پردازش تصویر رقمی، چاپ سوم، موسسه چاپ و انتشارات دانشگاه فردوسی مشهد، بهار ۱۳۸۵

[۳] Kapur , Jay P. , ” Face Detection in Color Images ” , University of Washington Department of Electrical Engineering , EE499 Capstone Design Project Spring 1997

[۴] D. Maio and D. Maltoni, “Real-time face location on grayscale static images,’’ Pattern Recognition, vol.33, no. 9, pp. 1525-1539, Sept. 2000

[۵] H. A. Rowley, S. Baluja, and T. Kanade, “Neural Network-Based Face Detection,” IEEE Trans. PAMI, vol. 20, pp. 23-38, Jan. 1998

[۶] K. K. Sung and T. Poggio, “Example-Based Learning for View-Based Human Face Detection,” IEEE Trans. PAMI, vol. 20, pp. 39-51, Jan. 1998

[۷] H. Schneiderman and T. Kanade, “A Statistical Method for 3D Object Detection Applied to Faces and Cars,” IEEE CVPR, June 2000

[۸] M. Abdel-Mottaleb and A. Elgammal, “Face Detection in complex environments from color images,’’ IEEE ICIP, pp. 622-626, Oct. 1999

[۹] J.C. Terrillon, M. N. Shirazi, H. Fukamachi, and S. Akamatsu, “Comparative performance of different skin chrominance models and chrominance spaces for the automatic detection of human faces in color images,’’ Proc. IEEE Int’l Conf. on Face and Gesture Recognition, pp. 54-61, 2000

[۱۰] T. Horprasert, Y. Yacoob, and L. S. Davis, “Computing 3-D Head Orientation from a Monocular Image,” Proc. Int’l Conf. Automatic Face and Gesture Recognition, pp. 242-247, Oct. 1996

[۱۱] F. Smeraldi, O. Carmona, and J. Bign, “Saccadic search with Gabor features applied to eye detection and real-time head tracking,’’ Image and Vision Computing, vol. 18, no. 4, pp. 323-329, 2000.

[۱۲] W. Huang, Q. Sun, C.-P. Lam, and J.-K. Wu, “A Robust Approach to Face and Eyes Detection from Images with Cluttered Background,’’ ICPR, vol. 1 , pp. 110-114, Aug. 1998

[۱۳] P. T. Jackway and M. Deriche, “Scale-space properties of the multiscale morphological dilation-erosion,’’ IEEE Trans. PAMI, vol. 18, pp. 38-51, Jan. 1996

[۱۴] C. Kotropoulos, A. Tefas, and I. Pitas, “Frontal face authentication using morphological elastic graph matching,’’ IEEE Trans. Image Processing, vol. 9, pp. 555-560, April 2000.

[۱۵] R. L. Hsu, M. Abdel-Mottaleb, and A. K. Jain, “Managing personal photo collection based on human faces,’’ Tech. Report, Michigan State Univ., Jan. 2001

[۱۶] Heinrich-Hertz-Institut (HHI)

[۱۷] The Champion dataset /

[۱۸] Hsu,Rein-Lien, Abdel-Mottaleb, Mohamed , Jain , Anil K.” FACE DETECTION IN COLOR IMAGES” , Dept. of Computer Science & Engineering, Michigan State University, MI 48824 * Philips Research, 345 Scarborough Rd., Briarcliff Manor, NY 10510

[۱۹] P.C. Cosman, R.M. Gray, M. Vetterli. “Vector Quantization of Image Subbands: A Survey.” IEEE Trans. on Image Processing. 5:2. pp. 202-225. Feb., 1996

[۲۰] ۴]B. D. Ripley. Pattern Recognition and Neural Networks. Cambridge University Press. 1996

[۲۱] V. N. Vapnik. The Nature of Statistical Learning Theory. Springer, 1995

[۲۲] Y. Freund, R. E. Shapire. “A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting.” Journal of Computer and System Sciences. 55:1, pp. 119-139. 1997

[۲۳] R. E. Shapire, Y. Singer. “Improving Boosting Algorithms Using Confidence-rated Predictions.” Machine Learning 37:3, pp. 297-336. December, 1999

[۲۴] H. Schneiderman and T. Kanade. “Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition.” CVPR ‘۹۸٫ pp. 45-51

[۲۵] K-K Sung, T. Poggio. “Example-based Learning of View-Based Human Face Detection.” ACCV ‘۹۵ and AI Memo #1521, 1572, MIT

[۲۶] H. Rowley, S. Baluja, T. Kanade. “Neural Network-Based Face Detection.” PAMI 20(1), January, 1998

[۲۷] Schneiderman , Henry , Kanade , Takeo , ” A Statistical Method for 3D Object Detection Applied to Faces and Cars “, Robotics Institute , Carnegie Mellon University , Pittsburgh , PA 15213

[۲۸] J. Terrillon, M. David, and S. Akamatsu. Automatic detection of human faces in natural scene images by use of a skin color model and of invariant moments. In Proc. of the Third International Conference on Automatic Face and Gesture Recognition, pages 112–۱۱۷, Nara, Japan, 1998

[۲۹] H. Rowley, S. Baluja, and T. Kanade. Neural network-based face detection. In Proc. IEEE Conf. on Computer Vision and Pattern Recognition, pages 203–۲۰۷, San Francisco, CA, 1996

[۳۰] M.P. Dubuisson and A.K. Jain. A modified Hausdorff distance for object matching. In ICPR94, pages A:566–۵۶۸, Jerusalem, Israel, 1994

[۳۱] W. Rucklidge. Efficient Visual Recognition Using the Hausdorff Distance, volume 1173 of Lecture notes in computer science. Springer, 1996

[۳۲] Jesorsky , Oliver , Kirchberg , Klaus J. , Frischholz , Robert W. , ” Robust Face Detection Using the Hausdorff Distance ” , BioID AG , Berlin , Germany , In proc.Third International Conference on Audio- and video-based Biometric Person Authentication, Springer ,Lecture Notes in Computer Science , LNCS-2091, pp. 90-95 ,Halmstad, Sweden, 6-8 June 2001

[۳۳] Oliver Jesorsky, Klaus J. Kirchberg, and Robert W. Frischholz. Robust Face Detection Using the Hausdor® Distance. In Josef Bigun and Fabrizio Smeraldi, editors, Audio- and Video-Based Person Authentication – AVBPA 2001, volume 2091 of Lecture Notes in Computer Science, pages 90{95, Halmstad, Sweden, 2001. Springer

[۳۴] W. Rucklidge. E±cient Visual Recognition Using the Hausdor® Distance, volume 1173 of Lecture notes in computer science. Springer, 1996

[۳۵] M.P. Dubuisson and A.K. Jain. A modi¯ed Hausdor® distance for object matching. In ICPR94, pages A:566{568, Jerusalem, Israel, 1994

[۳۶] John H. Holland. Adaption in Natural and Arti¯cial Systems. The University of Michigan Press, Ann Arbor, 1975

[۳۷] David E. Goldberg. Genetic Algorithms in Search, Optimization and Machine Learning. Addison Wesley, 1989

[۳۸] K. Messer, J. Matas, J. Kittler, J. Luettin, and G. Maitre. XM2VTSDB: Theextended M2VTS database. In Second International Conference on Audio and Video-based Biometric Person Authentication, pages 72{77, March 1999

[۳۹] BioID face database.

[۴۰] F. Smeraldi, N. Capdevielle, and J. Bigun. Facial features detection by saccadic exploration of the Gabor decomposition and Support Vector Machines. In Proceedings of the 11th Scandinavian Conference on Image Analysis – SCIA 99, Kangerlussuaq, Greenland, volume I, pages 39{44, June 1999

[۴۱] Kirchberg , Klaus J. , Jesorsky , Oliver , Frischholz , Robert W. , BioID AG, Germany, in Proc. International ECCV 2002 Workshop on Biometric Authentication, Springer, Lecture Notes in Computer Science ,LNCS-2359, pp. 103-11, Copenhagen ,Denmark, June 2002

[۴۲] Belongie , S, Carson, C, Greenspan, H, and Malik, J, “Color- and texture- based image segmentation using EM and its application to content-based image retrieval, ” Proc. 6^th IEEE Int. Conf. Computer Vision , Gan . 1998

[۴۳] Vezhnevets, Vladimir, Sazonov, Vassili, Andreeva, Alla, ” A Survey on Pixel-Based Skin Color detection Techniques” , submitted, 2003

[۴۴] Zarit, B. D., Super, B. J., and Quek, F. K. H., “Comparison of five color models in skin pixel classification ” , In ICCV,99 Int’l Workshop on Recognition , Analysis and Tracking of Faces and Gestures in Real-time Systems, 58-63, 1999

[۴۵] Terrilon, J. C., Shirazi, M. N., Fukamachi, H., and Akamatsu, S., “Comparative performance of different skin chrominance model and chrominance spaces for the automatic detection of human faces in color images”, In Proc. Of the International Conference on Face and Gesture Recognition, 54-61, 2000

[۴۶] Brand, J., and Mason, J., “A comparative assessment of three approaches to pixellevel human skin-detection”, In Proc. Of the International Conference on Pattern Recognition, vol. 1, 1056-1059, 2000

[۴۷] Lee, J. Y., and Yoo, S. I. , “An elliptical boundary model for skin color detection”, In Proc. Of the 2002 International Conference on Imaging Science Systems, and Technology ,2002

[۴۸] Shin, M.C, Chang, K.I, and Tsap, L.V, “Does Colorspace Transformation Make Any Difference on Skin Detection?” , IEEE Workshop on Application of Computer Vision , Orlando, FL, Dec 2002

[۴۹] Yang, J, and Waibel, A, “Tracking human faces in real-time ,” Proc. IEEE Workshop on Application of Computer Vision,1996

[۵۰] Jones, M. J., and Rehg, J. M, “Statistical color models with application to skin detection ” , In Proc. Submitted, vol. 1, 274-280, 2000

[۵۱] Albiol, A., Torres, L., Bouman, C.A., and Delp, E. J. , ” A simple and efficient face detection algorithm for video database application,” on Proceedings of the IEEE International Conference on Image Processing, Vacouver, Canada, vol. 2, pp. 239-242, September 2000

[۵۲] Wang, H. and Chang, S-F., ” A highly efficient system for automatic face region detection in mpeg video, “IEEE Transaction on circuits and system for video technology , vol. 7, no. 4, pp. 615-628, August 1997

[۵۳] Hsu, R.L, Abdel-Mottaleb, N., and Jain, A.K, ” Face Detection in Color Images,” IEEE Trans. On Pattern Analysis and Machine Intelligence Vol. 24, No. 5, pp. 696-706, 2002

[۵۴] Poynton, C.A. Frequently asked questions about colour. In

[۵۵] Fritsch, J, Lang, S, Kleinehagenbrock. M, Fink, G. A, and Sagerer, G,” Improving Adaptive Skin Color Segmentation by Incorporation Results from Face Detection”, Submitted, 2003

[۵۶] Phung, S. L., Bouzerdoum, A., and Chai, D, “A novel skin color model in ycbcr color space and its application to human face detection” , in IEEE International Conference on Image Processing (ICIP, 2002), vol. 1, 289-292, 2002

[۵۷] Menser, B., and Wien, M., “Segmentation and tracking of facial region in color image sequences”, In Proc. SPIE Visual Communication and Image Processing, 731-740, 2000

[۵۸] Ahlberg, J., “A system for face localization and facial feature extraction” , Tech. Rep. LiTH-ISY-R-2172, Linkoping University, 1999.

[۵۹] Chai, D., and Bouzerdoum, A, “A Bayesian approach to skin color classification in ycbcr color space “, In proceedings IEEE Region Ten Conference (TENCON,2000), vol. 2, 421-424, 2000

[۶۱] Saber, E. and Tekalp, A.M. , “Frontal-view Face Detection and Facial Feature Extraction using Color ” , shape and Symmetry Based Cost Function” Pattern Recog Letters , vol. 19, no. 8, pp. 669-680, 1998

[۶۲] Marques, F., and Vilaplana, V, ” A morphological approach for segmentation and tracking of human faces” , In International Conference on Pattern Recognition (ICPR,00), Vol. 1, 5064-5068, 2000

[۶۳] Brown, D., Craw, I., and Lewthwaite, J., ” A som based approach to skin detection with application in real time system”, In Proc. Of the British Machine Vision Conference , 2001

[۶۴] Alboil, A., Torres, L., and Delp, E. J. ” Optimum color space for skin detection”, In Proceedings of the International Conference on Image Processing, vol. 1, 122-124, 2001

[۶۵] Yang, M.,and Ahuja, N., ” Gaussian mixture model for human skin color and its application in image and video database “, In Proc. Of the SPIE: Conf. on Storage and Retrieval for image and video Databases (SPIE 99), vol. 3656, 458-466, 1999

[۶۶] Goldstein, A. J., Harmon, L.D., and Lesk, A. B., “Identification of Human Faces,” Proc. IEEE, May 1971, vol. 59, No. 5, 748-760

[۶۷] Sirovich, L., and Kirby , M., ” A Low-Dimensional Procedure for the characterization of Human Faces,” J. Optical Soc. Am. A, 1987, Vol. 4, No. 3, 519-524

[۶۸] Turk, M. A., and Pentland, A. P., ” Face Recognition Using Eigenfaces,” Proc. IEEE, 1991, 586-591

[۶۹] Bolme, D., Beveridge, R., Teixeria, M., and Draper, B., ” The CSU Face Identification Evaluation System : Its Purpose , Feature and Structure,” International Conference on Vision Systems, Graz, Austria, April 1-3, 2003. (Springer-Verlag) 304-311

[۷۰] “Eigenfaces Recognition”

[۷۱] Plataniotis, J. Lu, K. N., and Venetsanopoulos, A. N., ” Regularized Discriminant Analysis for the Small Samole Size Problem in Face Recognition, ” Pattern Recognition Letters, December 2003, Vol. 24, Issue 16: 3079-3087

[۷۲] Phillips, P. J., Moon, H., Risvi, S. A., and Rauss, P. J., ” The FERET Evaluation Methodology for Face-Recognition Algorithms,” IEEE Transaction on PAMI., 2000, Vol. 22, No. 10: 1090-1104

[۷۳] Blackburn, D. M., Bone, J. M., and Phillips, P. J., ” facial Recognition Vender Test 2000 Evaluation Report, ” February 2001, <http://www.frvt.org.

[۷۴] Phillips, P. J., Grother, P., Micheals, R. J., Blackburn, D. M., Tabassi, E., Bone, J. M., “Face Recognition Vender Test 2002 Overview and Summary,” March 2003,

[۷۵] Phillips, P. J., Flynn, P. J., Scruggs, T., Bowyer, K. W., Change, K., Hoffman, J., Marques, J., min, and Worek, W., ” Overview of the face Recognition Grand Challenge,” Proc. Computer Vision and Pattern Recognition Conference, San Diego, 2005

[۷۶] “Information technology – Biometric data interchange formats – Part 5: Face image data. ” Documents ISO/IEC 19794-5:2005, 2004 , />

[۷۷] “] “Information technology –Face Recognition Format for Data Interchange,” document 385-2004 ANSI INCITS, 2004 />

[۷۸] Phillips, P. J., Moon, H., Rauss, P., and Rizvi, S.,. The FERET evaluation methodology for face-recognition algorithms. In Proceeding Computer Vision and Pattern Recognition 97, pages 137-143, 1997

[۷۹] Phillips, P. J., Moon, H., Rizvi, S., and Rauss, P.,. The feret evaluation. In Phillips, P. J., Bruce, V., Fogelman Soulie, F., and Huang, T. S., editors, Face Recognition : From Theory to applications. Springer-Verlag, Berlin, 1998

[۸۰] Phillips, P. J., Wechsler, H., Huang, J., and Rauss, P., . The FERET database and evaluation procedure for face-recognition algorithms. Image and Vision Computing Journal, 16(5) : 295-306, 1998

[۸۱] Moghaddam, B., and Pentland, A., . Probabilistic visual learning for object detection. In Proceedings of the Inter. Conf. on Computer vision, pages 786-793, 1995

[۸۲] Pentland, A., Moghaddam, B., and Starner, T.,. View-based and modular eigenpaces for face recognition. In Proceedings Computer Vision and Pattern Recognition 94, pages 84-91, 1994

[۸۳] Moghaddam, B., Naster, C., and Pentland, A., . Bayesian face recognition using deformable intensity surface. In Proceedings Computer Vision and Pattern recognition 96, pages 638-645, 1996

[۸۴] Egan, J. P. Signal Detection Theory and ROC Analysis. Academic Press, 1975

[۸۵] Green, D., and Swets, J.,. Signal Detection Theory and psychophysics. John Wiley & Sons Ltd., 1966

[۸۶] Rizvi, Syed A., Phillips. P. Jonathon, and Moon, Hyeonjoon. “The Feret Verification Testing Protocol for Face Recognition Algorithms”, NISTIR 6281, October 1998

[۸۷]Chang, Henry, Robels, Ulises, “Face Detection” , EE368 Final Project Report – Spring 2000

[۸۸] Yang, Jie. And Waibel, Alex. ” A Real-Time Face Tracker”, CMU CS Technical Report”

[۸۹] Cai . A., & Goshtasby & Yu, C., “Detecting Human Faces in Color Images”, Wright State University, U. of Illinois

[۹۰] Gong, Y. and Sakauchi, M. “Detection of regions matching specified chromatic features”, Computer Vision and Image Understanding, vol. 61, no. 2, 1995, pp 263 – ۲۶۹

[۹۱] Ramesh, R., Kasturi R. and Schunck B., Machine Vision, pp 31 – 51, McGraw Hill, New York 1995

[۹۲] Wyszecki, G. and Styles ,W.S. Color Science: Concepts and Methods, Quantitative Data and Formulae, second edition, John Wiley & Sons, New York 1982

۱-۱ : مقدمه

پردازش تصویر دیجیتال[۱] دانش جدیدی است که سابقه آن به پس از اختراع رایانه های دیجیتال باز می گردد . با این حال این علم نوپا در چند دهه اخیر از هر دو جنبه نظری و عملی پیشرفت های چشمگیری داشته است . سرعت این پیشرفت به اندازه ای بوده است که هم اکنون و پس از این مدت نسبتاً کوتاه ، به راحتی می توان رد پای پردازش تصویر دیجیتال را در بسیاری از علوم و صنایع مشاهده نمود . علاقه به روش های پردازش تصویر دیجیتال از دو محدوده کاربردی اصلی نشات می گیرد که آن محدوده ها عبارتند از : بهبود اطلاعات تصویری به منظور تعبیر انسانی و پردازش داده های صحنه برای ادراک ماشینی مستقل .

چند دسته مهم از کاربرد های پردازش تصویر به شرح زیر می باشد [ ۱ ] :

الف ) کاربردهای عکاسی مانند ارتقاء ، بازسازی تصاویر قدیمی ، بازسازی تصاویر خراب شده با نویز و بهبود ظاهر تصاویر معمولی.

ب ) کاربرد های پزشکی مانند ارتقاء ویژگی های تصاویر اشعه ایکس ، تولید تصاویر MRI وCT-scan.

ج ) کاربرد های امنیتی مانند تشخیص حرکت ( در دزد گیر ها ) ، تشخیص اثر انگشت ، تشخیص چهره و تشخیص امضاء.

د ) کاربرد های نظامی مانند تشخیص و رهگیری خودکار اهداف متحرک یا ثابت از هوا یا از زمین.

ه ) کاربرد های سنجش از راه دور مانند ارتقاء و تحلیل تصاویر هوایی و ماهواره ای (برداشته شده از مناطق مختلف جغرافیایی) که در کاربرد های نقشه برداری ، کشاورزی ، هوا شناسی و موارد دیگر مفید هستند .

و ) کاربرد های صنعتی مرتبط با خودکار سازی صنایع مانند تفکیک محصولات مختلف بر اساس شکل یا اندازه ، آشکارسازی نواقص و شکستگی های موجود در محصولات ، تعیین محل اشیاء و اجرای فرایند تولید با استفاده از روبات ها و بینایی ماشینی .

ز ) کاربرد های فشرده سازی تصویر مانند ذخیره سازی ، ارسال تصاویر تلویزیون با کیفیت بالا و ارسال تصاویر متحرک و زنده از روی شبکه اینترنت و یا خط تلفن.

ح ) موارد متفرقه دیگری نیز مانند تصویر برداری از اسناد و ارسال آنها توسط دور نگار و تشخیص خودکار نویسه در ردیف کاربرد های پردازش تصویر قرار دارند.

۱-۲ : مراحل اساسی پردازش تصویر

پردازش تصویر دیجیتال محدوده وسیعی از سخت افزار ، نرم افراز و مبانی نظری را در بر می گیرد . در این قسمت مراحل اساسی مورد نیاز برای اجرای یک پردازش روی تصویر را نام می بریم که در شکل ۱-۱ نمایش داده شده است .

مرحله اول این فرایند ، تصویر برداری[۲] – یعنی به دست آوردن تصویر دیجیتال – است . انجام دادن چنین کاری نیازمند یک حسگر تصویر بردار[۳] و قابلیت دیجیتال سازی سیگنال خروجی حسگر می باشد . پس از اینکه تصویر دیجیتال به دست آمد ، مرحله بعدی پیش پردازش آن است . وظیفه اصلی پیش پردازش ، بهبود تصویر به روش هایی است که امکان توفیق سایر پردازش ها را نیز افزایش دهد . پیش پردازش ، به طور معمول به روش هایی برای ارتقاء تمایز ، حذف نویز و جداسازی آن نواحی که زمینه شان نشان دهنده احتمال وجود اطلاعات حرفی – عددی است ، می پردازد . مرحله بعدی به بخش بندی[۴] می پردازد . در تعریف وسیع ، بخش بندی فرایندی است که تصویر ورودی را به قسمت ها یا اجزای تشکیل دهنده اش تقسیم می کند . به طور کلی بخش بندی یکی از مشکل ترین کارها در پردازش تصویر دیجیتال است . از طرفی یک شیوه قوی بخش بندی ، تا حد زیادی فرایند را به حل موفق مساله نزدیک می کند . از طرف دیگر الگوریتم های ضعیف یا خطا دار بخش بندی ، تقریباً همیشه باعث خرابی اتفاقی [۵]می شوند . خروجی مرحله بخش بندی معمولاً ، داده های پیکسلی خام است که یا مرز یک ناحیه یا تمام نقاط درون آن ناحیه را تشکیل می دهند . در هر دو حالت باید داده ها را به شکل مناسب برای پردازش رایانه ای تبدیل نمود . اولین تصمیمی که باید گرفته شود این است که آیا داده ها باید به صورت مرز یا به صورت یک ناحیه کامل نمایش داده شود . نمایش مرزی وقتی مفید است که مشخصات خارجی شکل نظیر گوشه ها یا خمیدگی ها مورد نظر باشد . نمایش ناحیه ای وقتی مفید است که خواص درونی بخش های تصویر نظیر بافت یا استخوان بندی شکل مورد توجه باشد . در هر حال در بعضی کاربرد ها هر دو نمایش به کار می رود . انتخاب یک روش نمایش ، تنها قسمتی از راه تبدیل داده های خام به شکل مناسب برای پردازش بعدی رایانه ای است . توصیف[۶] ، که انتخاب ویژگی[۷] نیز خوانده می شود ، به استخراج ویژگی هایی که مقداری از اطلاعات کمی مورد نظر را به ما می دهند یا برای تشخیص گروهی از اشیاء از گروه دیگر ، اساسی هستنند ، می پردازد . مرحله آخر شکل ۱-۱ شامل تشخیص و تعبیر است . تشخیص[۸] فرایندی است که بر اساس اطلاعات حاصل از توصیف گرها یک برچسب را به یک شی منتسب می کند . تعبیر[۹] شامل انتساب معنا به یک مجموعه از اشیاء تشخیص داده شده است . دانش به شکل پایگاه داده دانش[۱۰] در درون سامانه پردازش تصویر ، ذخیره می شود . این دانش ممکن است ، تنها دانستن محل نواحی دارای جزئیات مورد علاقه باشد . بنابراین جستجوی مورد نیاز برای آن اطلاعات محدود می شود . پایگاه دانش ممکن است کاملاً پیچیده باشد ، نظیر فهرست به هم مرتبط تمام نقایص اصلی ممکن در یک مساله بازرسی مواد یا یک پایگاه داده تصویری که حاوی تصاویر ماهواره ای تفکیک بالا از یک منطقه در ارتباط با کاربرد های آشکارسازی تغییر[۱۱] باشد . پایگاه دانش علاوه بر هدایت عمل هر واحد پردازش ، بر تعامل بین واحد ها نیز نظارت می کند . این نمودار نشان می دهد که ارتباط بین واحد های پردازش اغلب براساس دانش قبلی در مورد نتیجه پردازش است . این پایگاه دانش نه تنها عمل هر واحد را هدایت می کند ، بلکه به عملیات بازخورد[۱۲] بین واحد ها نیز کمک می کند [۱].

۱-۳ : یک مدل ساده تصویر

عبارت تصویر به تابع دو بعدی شدت نور که به صورت نوشته می شود ، اشاره دارد که مقدار یا دامنه در مختصات مکانی ، شدت روشنایی تصویر در آن نقطه می باشد . چون نور صورتی از انرژی است ، باید بزرگتر از صفر و متناهی باشد ، یعنی تصاویر دریافتی در فعالیت های روزانه معمولاً نور منعکس شده از اشیا است . طبیعت پایه ای را می توان با دو عامل مشخص نمود : (۱) مقدار نور تابشی از منبع روی صحنه ای که دیده می شود و (۲) مقدار نور منعکس شده به وسیله اشیاء صحنه .

این دو عامل به ترتیب مولفه های روشنائی و انعکاس[۱۳] نامیده می شوند و به ترتیب با و نشان داده می شوند . توابع و به شکل حاصل ضرب ترکیب می شوند تا ایجاد شود :

شدت تصویر تکرنگ در مختصات را سطح خاکستری تصویر در آن نقطه می نامیم .

بازه محدوده خاکستری نامیده می شود . معمولاً تلاش می شود که این بازه را به بازه که در آن بیانگر سیاه و بیانگر سفید است ، تغییر دهیم . تمام مقادیر میانی سایه های خاکستری هستند که به طور پیوسته از سیاه تا سفید تغییر می کنند[۱] .

۴-۱: تشخیص صورت

یکی از مهم ترین کاربرد های پردازش تصویر دیجیتال در زمینه ی تشخیص صورت است . تشخیص صورت ، محبوبیت و اهمیت زیادی را در جامعه بصری کامپیوتری[۱۴] بدست آورده است . با حضور همزمان تکنولوژی اطلاعاتی جدید و رسانه های گروهی ، روش های موثر تر و آشنا تری برای برهم کنش های انسان – کامپیوتر[۱۵] (HSI) توسعه داده می شوند ، واسط های انسان – کامپیوتر که بر مبنای حالات چهره و حرکات بدن انسان می باشند ، به عنوان روش هایی مورد استفاده قرار گرفته اند که جایگزین واسط های سنتی از قبیل صفحه کلید ،‌ ماوس و نمایشگر ها شده اند . تحقیقات در حال گسترش در ارتباط با پردازش صورت بر این اساس هستند که اطلاعاتی درباره هویت ، موقعیت و مقصود یک کاربر از تصاویر قابل استخراج باشند و متعاقباً کامپیوتر متناظر هم بتواند واکنش نشان دهد . تلاش های صورت گرفته در پردازش صورت ، شامل شناسایی صیورت ، ردیابی صورت ، شناسایی حالت چهره ، تصدیق صورت و تشخیص صورت می باشد . برای ساختن سیستم های خودکاری که اطلاعات قرار کرفته در تصاویر صورت را آنالیز کنند ، الگوریتم های موثر و قدرتمندی از تشخیص صورت مورد نیاز است . با داشتن یک تصویر مجزا ،‌ هدف تشخیص صورت ، تعیین تمام نواحی صورت است که شامل صورت می باشند ، با صرف نظر کردن از وضعیت سه بعدی تصویر ، جهت و شرایط روشنایی آن . در سالهای اخیر فعالیت های بسیاری در زمینه ی شناسایی و تشخیص صورت انجام گرفته است . کاربردهای نظارتی و کنترلی و تجاری بسیاری در حوزه این فعالیت ها ،‌توسعه داده شده اند . تکنیک های بیشماری برای تشخیصی صورت در تصاویر مجزا پیشنهاد شده اند . این روش ها به دو دسته کلی تر مبتنی بر ویژگی و تصویر تقسیم بندی شده اند . که هر یک مزایا و معایب خاص خود را دارند . از بین این روش ها ، روش مبتنی بر رنگ و شبکه ی عصبی و ماشین بردار حمایتی (SVM) ، رایج تر هستند و کارایی آنها به مراتب بیشتر از سایر روش هاست . تکنیک های مبتنی بر رنگ اغلب خیلی مطمئن هستند ،‌ اما ممکن است که منجر به تشخیص های غلط بی شماری شوند ، در نتیجه نیاز به آن دارند که با سایر روش ها ترکیت شوند . شیوه های شبکه ی عصبی و ماشین بردار حمایتی که مبتنی بر الگوریتم های یادگیری و رده بندی هستند عمدتاً شامل پارامتر های بی شماری هستند که نیار به تنظیم دارند که مسلماً این عملیات وقت گیر است . با داشتن یک تصویر دلخواه به عنوان ورودی ، که می تواند از ویدئو و یا یک عکس بی جانی ، ‌حاصل آمده باشد ، هدف تشخیص صورت ، تعیین این مساله است که آیا صورتی در تصویر وجود دارد یا خیر ، و اگر وجود داردموقعیت و محدوده ی هر صورت را برمی گرداند . فعالیت هایی که در زمینه ی تشخیص صورت ، انجام گرفته به اوایل سال ۱۹۷۰ بر می گردد . هر چند برای بیشتر از بیست سال است که این امر توسط مهندسان و روانشناسان مورد مطالعه ی جدی قرار گرفته است ،‌و مخصوصاً از سال ۱۹۹۵ ، روش های بسیاری در تلاش برای حل این مسئله ، توسعه داده شده اند . در حقیقت ما تصاویری را که فقط حاوی قورت باشد را دریافت نمی کنیم . به سیستمی نیاز هست که صورت ها را در تصاویر درهم ، تشخیصی ،‌تعیین موقعیت و جدا کند و در نتیجه ی آن ، این صورت های جداسازی شده می توانند به عنوان ورودی به سیستم های تشخیص [۱۶]چهره تحویل داده شوند . عمل تشخیص صورت برای مغز بشری ، یک عمل جزئی و کم اهمیت است ، در حالی که هنوز چالش ها و مشکلات سختی را برای آنکه کامپیوتر قادر به انجام تشخیص صورت ،‌ باشد باقی گذاشته است . چالش هایی که با تشخیص صورت مرتبط هستند را در موارد زیر خلاصه می کنیم :

– وضع [۱۷]صورت : تصاویر یک صورت متناظر با وضعیت های مختلف قرار گیری دوربین – صورت ، همچون روبرو ، تمام رخ ، ۴۵ درجه ، وارون و …. تغییر می کنند . کل این وضعیت ها را به بالا ، پایین و عادی تقسیم می کنیم که قرار گیری صورت نسبت به محور مستقیم دوربین را نشان می دهند .

– وجود یا عدم وجود مولفه های ساختاری[۱۸]: مولفه های اضافی مرتبط با صورت همچون سبیل ، ریش ، کلاه و عینک هستند که ممکن است وجود داشته باشند یا نداشته باشند . این مولفه ها در صورت وجود تغییرات زیادی را موجب می شوند .

– حالات چهره [۱۹] : ظاهر صورت مستقیماً متاثر از حالات چهره ی اشخاص است .

– انسداد[۲۰] یا همپوشانی : صورت ها ممکن است به طور جزئی توسط اشیاء دیگر از جمله صورت دیگر یا کلاه و … پوشیده شده باشند .

– شرایط تصویر[۲۱] : زمانی که تصویر ایجاد می شود ، عواملی چون روشنایی ( طیف ها ، توزیع منبع و شدت[۲۲]) و مشخصات دوربین ( واکنش حسگر و لنز ها ) می توانند روی ظاهر یک صورت تاثیر بگذارند .

– تاثیر رنگ یا به هم ریختگی زمینه : صورت ها ممکن است در زمینه های پیچیده ظاهر شوند که در این صورت ، اشییایی که رنگ مشابهی با پوست دارند ،‌ نیز به اشتباه ممکن است ، شناسایی شوند .

از نتیجه حاصله از عملیات تشخیص صورت بر روی عکس ورودی می توان در زمینه های دیگری استفاده نمود . از جمله :

مکان یابی صورت[۲۳] : این عمل ، موقعیت تصویر را از یک صورت تک مشخص می کند .

تشخیص خصائص صورت[۲۴] : هدف از انجام این عمل ، تشخیص وجود و موقعیت خصایص صورت ، همچون چشم ها ، بینی ، ابرو ، دهان ، لب ها ، گوش ها و …. می باشد .

شناسائی صورت[۲۵]: یک تصویر ورودی ( کاوشگر) را با یک پایگاه داده (گالری ) ، مقایسه می کند و یک تطابق[۲۶] را اگر وجود داشته باشد ، گزارش می دهد .

ردیابی صورت[۲۷] : روش های ردیابی صورت ، پیوسته موقعیت و احتمالاً جهت یک صورت را در دنباله ای از تصویر در بلادرنگ [۲۸]، بر آورد می کنند .

۱-۵ : تشخیص و تعبیر

در این قسمت با ارائه چند روش تشخیص و تعبیرتصویر ، مبحث پردازش تصویر دیجیتال را پایان می دهیم .

تحلیل تصویر شامل فرآیند های کشف ، شناسایی و فهم الگو های مرتبط با یک کار تصویری است . یکی از اهداف اصلی تحلیل رایانه ای تصویر این است که ماشین بتواند بعضی توانایی های انسان را تا حدودی تقریب بزند . بنابراین سامانه خودکار تحلیل تصویر باید بتواند درجات گوناگونی از هوشمندی را ارائه کند . مفهوم هوشمندی[۲۹] تا حدی ، به ویژه راجع به ماشین ، تقریبی است . با این حال شناخت انواع مشخصه هایی که معمولاً با هوشمندی مرتبط هستند ، مشکل نیست . در این مورد چند مشخصه فوراً به ذهن می آیند : (۱) توانایی استخراج اطلاعات مرتبط از زمینه ای با جزئیات نامرتبط ؛. (۲) توانایی یادگیری از مثال ها و تعمیم آن طوری که در شرایط جدید و متفاوت قابل استفاده باشد و (۳) توانایی استنتاج از اطلاعات ناقص .

قسمت اعظم تحلیل تصویر رایانه ای کنونی بر اساس روابط تجربی که برای حل مسائل خاصی طرح شده اند ، می باشد . مثلاً بعضی ماشین ها قادرند نوشته های چاپی را که قالب مناسبی داشته باشند ، با سرعت هایی که بارها سریع تر از سرعت خواندن ماهرترین انسان ها است ،‌ بخوانند . با این حال این نوع سامانه ها بسیار خاص هستند و توسعه پذیری کمی دارند یا اصلاً توسعه پذیر نیستند . بنابراین محدودیت های عملی و نظری فعلی در مبحث تحلیل تصویر ،‌ راه حل هایی را تحمیل می کنند که شدیداً وابسته به مساله هستند .

تقسیم روش های تحلیل تصویر به سه گروه اصلی مفید به نظر می رسد . این گروه ها عبارتند از : (۱) پردازش سطح پایین ،‌(۲) پردازش سطح میانی و (۳) پردازش سطح بالا . گر چه این تقسیم بندی ها مرز های قطعی ندارند ، ‌اما چهار چوب مفیدی برای دسته بندی فرآیند های مختلفی که اجزای اصلی سامانه خودکار تحلیل تصویر هستند ، فراهم می آورند . پردازش سطح پایین[۳۰] به اعمالی گفته می شود که واکنش هایی خودکار هستند و اصلاً نیازی به هوشمندی ندارند . ما تصویر برداری و پیش پردازش[۳۱] را به عنوان اعمال سطح پایین در نظر می گیریم . این گروه شامل فعالیت هایی از تشکیل تصویر تا جبران سازی هایی نظیر کاهش نویز یا مات زدایی می شود . پردازش سطح میانی[۳۲] به عمل استخراج و مشخص کردن اجزای ( مثلاً نواحی ) تصویر که حاصل فرآیند سطح پایین هستند ، می پردازد . فرآیندهای سطح میانی شامل بخش بندی و توصیف می باشد . در نهایت پردازش سطح بالا[۳۳] شامل تشخیص و تعبیر است . این دو فرآیند تشابه بیشتری به مفهوم عام درک هوشمندانه[۳۴] دارند . در ادامه از بین روش های موجود سه روش به طور خلاصه شرح داده می شود : (۱) روش های تشخیص با نظریه تصمیم[۳۵] تشخیص ، (۲) روش های ساختاری تشخیص و (۳) روش های تعبیر تصویر . تشخیص با نظریه تصمیم بر اساس نمایش الگوها به شکل بردار و سپس جستجوی روش هایی برای گروه بندی و انتساب این بردار ها به دسته الگوهای متفاوت است . روش های اصلی تشخیص با تظریه تصمیم ، دسته بندی کننده های حداقل فاصله ، همبسته سازها ،‌ دسته بندی کننده بیز[۳۶] و شبکه های عصبی هستند . در تشخیص ساختاری الگوها به شکل نمادین (نظیر رشته ها یا درخت ها ) نمایش داده می شوند و روش های تشخیص بر اساس تطبیق نماد یا براساس مدل هایی هستند که با الگوها نمادی به عنوان جمله هایی از یک زبان مصنوعی رفتار می کنند . تعبیر تصویر به مجموعه ای از عناصر تصویری تشخیص داده شده ، معنا نسبت می دهد . مهمترین مفهومی که زیر بنای روش های تعبیر تصویر است ،‌ سازماندهی و استفاده موثر از دانش درباره حوزه مورد نظر است . روش های فعلی تعبیر تصویر بر اساس منطق گزاره ها ، شبکه های معنایی[۳۷] و سامانه فرآوری[۳۸] (به ویژه خبره[۳۹]) هستند [۱] .

۲-۱ : تشخیص صورت در تصاویر رنگی با استفاده از فیلتر پوست

در این روش یک تکنیک برای تشخیص چهره انسان به صورت اتوماتیک در عکس های رنگی دیجیتال بیان می شود.این سیستم برمبنای یک پروسه دو مرحله ای می باشد که در مرحله اول ناحیه احتمالی شامل پوست انسان در تصویر رنگی مشخص می شود.درقسمت دوم مختصات مکان احتمالی صورت در تصویر را می دهد. در این روش تشخیص پوست با استفاده از یک فیلتر که برپایه اطلاعات بافت , تاروپود و رنگ می باشد انجام می گیرد. در مرحله بعد تشخیص صورت روی تصویر در مقیاس خاکستری که فقط شامل نواحی کشف شده پوست می باشد صورت می گیرد. با ترکیب عملیات مورفولوژیکی و آستانه گیری[۱], خصوصیات اجزائی که حضور صورت را مشخص می کنند از تصویر استخراج می شوند. این پروسه همان طور که نتایج نشان می دهند روشی قابل اعتماد می باشد.

۱-۱-۲: چکیده

در این روش یک الگوریتم اولیه برای تشخیص صورت انسان در تصاویر دیجیتالی به صورت اتوماتیک بیان شده و می تواند به عنوان مقدمه ای برای تحقیقات آتی در زمینه تشخیص صورت در تصاویر باشد. سیستم های زیادی به منظور تشخیص صورت توسط گروههای تحقیقاتی زیادی طراحی و پیشنهاد شده اند. تعدادی از این برنامه ها مانند Rawley , Raluja و Kanade بر مبنای آموزش شبکه های عصبی و محاسبه اندازه فاصله بین مجموعه های آموزشی برای تشخیص صورت می باشد. بقیه بسته های نرم افزاری که در این زمینه وجود دارند، می توانند ویژگی های مربوط به صورت را در تصا ویری تشخیص دهند که در آن ها وجود چهره انسان در جائی از تصویر محرز شده باشد. اما در روشی که در ادامه ارائه می شود تشخیص صورت بر روی عکس های رنگی دلخواه متمرکز شده و با سیستم های نوع اول که بر مبنای ترکیب اطلاعات در مقیاس خاکستری و رنگی می باشند تفاوت دارد.

علاوه بر موارد فوق، این روش نیاز به صرف زمان برای آموزش شبکه های عصبی یا محاسبه اندازه های فاصله بین هر ناحیه احتمالی پوست در تصویر را ندارد. همچنین این سیستم با بسته های نرم افزاری که ویژگی های مربوط به صورت را تشخیص می دهند تفاوت دارند زیرا در این سیستم هدف تشخیص ناحیه احتمالی در هر عکس اختیاری و دلخواه در صورت وجود می باشد، نه آنالیز تصاویری که وجود یک صورت در آن ها از قبل محرز شده اند. این پروسه برمبنای دو گام می باشد؛ گام اول: در تصاویر فیلتر شده نواحی احتمالی شامل پوست انسان مشخص و علامت گذاری می شوند. این فیلتر با استفاده از توابع ریاضی ساده و توابع پردازش تصویر در متلب [۲] طراحی شده است و برمبنای فیلتر پوستی که برای The Berkeley-Iowa Naked People Finder طراحی شده می باشد. تغییرات اعمال شده در الگوریتم به منظور دست یابی به نتایج بهتر صورت گرفته شده است. در مرحله دوم نواحی پوستی مشخص شده را جدا نموده و تاریکترین و روشن ترین ناحیه ها از نقشه برداشته می شوند. روی این نواحی تاریک و روشن تست ها ی عملی و تجربی انجام می شود تا تطابق آن ها با نواحی مثل چشم و ابرو و سوراخ بینی و دهان معین شود. در نهایت نواحی که پس از انجام چند مرحله آنالیز حاوی سوراخ می باشند به عنوان نواحی احتمالی برای انجام مراحل فوق از ترکیبی از توابع متلب و برنامه Khoros استفاده می شود. در آخر، سیستم نهائی به صورت اتوماتیک در می آید و نیازی به مداخله کاربر ندارد. مرحله سوم این روش که در این پروژه بیان نشده و باید تکمیل شود شامل بررسی تمایز اندازه های سوراخ ها و فاصله ی آن ها برای دست یابی به سیستم تشخیص صورت قوی تر می باشد.

۲-۱-۲ : فیلتر پوست

فیلتر پوست مورد استفاده بر مبنای الگوریتم Fleck & Fosyth می باشد که تغییراتی در آن اعمال شده و در [۲] مورد مقایسه قرار گرفته اند. در این روش فیلتر در متلب ساخته شده است. با وجود این که چندین تابع پردازش تصویر سطح پایین در مطلب وجود دارد اما این روش احتیاج به زمان داشت تا یک الگوریتم برای فیلتر کاربردی را بسازد، نه این که کدهای تابع سطح پایین را بنویسد. در ادامه توضیح مختصری در مورد نحوه کار فیلتر داده می شود. فرمت توابع فیلتر در متلب در سایت مربوطه قابل دسترسی می باشد[۳]. لازم به ذکر است که عکس رنگی ورودی باید به فرمت RGB با شدت رنگ در رنج تا باشد. به دلیل محدودیت های موجود در زمینه اجرای برنامه و سرعت آن در این روش از عکس های با سایز کوچکتر از استفاده شده است. به منظور جلوگیری از بروز اشباع حین تبدیل تصویر از فرمت RGB به IRgBy، پاسخ صفر ماتریس RGB محاسبه شده و از سه مولفه فضای رنگی RGB کم می شود.

سپس ماتریس های , به وسیله فیلتر پنجره متوسط [۵]با اضلا عی با طول فیلتر می شوند. نزدیکترین مقدار صحیح به می باشد.

یک نقشه بافت و ساختار[۶] برای پیدا کردن نواحی با اطلاعات کم در مورد بافت به کار می رود. پوست در تصاویر دارای بافت صاف و هموار می باشد، بنابراین یکی از روش های کشف نواحی پوست در عکس انتخاب نواحی با بافت هموار می باشد. نقشه بافت به روش زیر از ماتریس ساخته می شوند :

۱( فیلتر کردن با استفاده از فیلتر متوسط به وسیله یک پنجره با طول

۲( کم کردن عکس فیلتر شده از ماتریس اصلی

۳( بدست آوردن قدر مطلق تفاضل و فیلتر کردن نتیجه به وسیله پنجره ای به طول

تصاویر رنگمایه و اشباع برای انتخاب نواحی که رنگ آن ها با رنگ پوست تطابق دارد استفاده می شوند. تبدیل IRgBy به رنگمایه و IRgBy به اشباع به وسیله روابط زیر صورت می گیرد که مفدار رنگمایه با درحه بیان می شود :

Hue = (atan^2 (Rg,By))

Saturation = sqrt(Rg^2 + By^2)

با به کاربردن تصاویر نقشه بافت و ساختار، رنگمایه و اشباع نواحی شامل پوست مشخص می شود.

در نقشه بافت و ساختار اگر هرمقدار پیکسل شرایط زیر را بر آورده سازد به عنوان پوست در نظر گرفته می شود و در تصویر باینری پوست[۷] عدد ۱ به آن نسبت داده می شود در غیر این صورت صفر :

۱) texture < 4.5 ,120

۲) texture<4.5 , 150

تصویر باینری یک تصویر سیاه و سفید می باشد که قسمت های سفید مربوط به نواحی شامل پوست است.

نواحی نقشه باینری پوست با استفاده از عامل گسترش [۸] و عنصر با ساختار گرد[۹] توسعه می یابد.

این کار باعث می شود تا نواحی نقشه پوست بزرگ تر شوند تا پیکسل های مرزی بین پوست و زمینه، نواحی نزدیک مو و دیگر اجزا و… را نیز در برگیرند. گسترش پیکسل های ۸ متصله را به لبه اشیا اضافه می کند. بدین منظور، عملیات گسترش به صورت بازگشتی پنج مرتبه برای دست یابی به نتایج بهتر اعمال می شود. در مرحله بعد به منظور جداسازی از بازه های زیر استفاده می شود. اگر نواحی احتمالی پوست در تصویر باینری در محدوده های زیر قرار بگیرند به عنوان پوست در نظر گرفته می شوند :

۰<= saturation <= 130 , ۱۱۰ <= hue <= 180

لازم به ذکر است که فیلتر پوست هنوز کامل نمی باشد زیرا به دلیل خطا های برنامه نویسی یا اعمال حدود نامناسب، نقاط زرد و قرمز به عنوان پوست شناخته می شوند. اغلب این مشکلات در تشخیص صورت هنگامی اتفاق می افتد که یک شی قرمز یا زرد بزرگ در تصویر وجود داشته باشد.

۲-۱-۳ : تشخیص صورت در نواحی پوست

در این مرحله تصویر باینری و عکس اصلی برای تشخیص صورت به کار می روند. تکنیک بر مبنای آستانه گیری ناحیه پوست می باشد. بدین ترتیب سوراخ ها ئی در ناحیه صورت از ابرو و چشم و دهان و بینی ظاهر می شود. بر مبنای فرضیه های علمی، دیگر قسمت های پوست، به غیر از موارد ذکر شده فاقد سوراخ می شوند، یعنی بعد از آستانه گیری فقط در موارد ذکر شده سوراخ ظاهر می شود. این متد به نظر ساده می رسد، ولی با اضافه کردن بعضی محدودیت ها می تواند نسبت به پروسه شبکه های عصبی قوی تر، سریعتر و راحتتر باشد. تشخیص ناحیه صورت به دو مرحله تقسیم می شود.

قسمت اول استفاده از برنامه Khoros و قسمت دوم استفاده از توابع متلب می باشد. در گام اول باید مطمئن شویم که نقشه پوست از نواحی جسم ساخته شده است (یعنی بدون سوراخ باشد) . بستن سوراخ ها[۱۰] به وسیله یک عنصر با ساختار گرد ۳*۳ روی نقشه پوست انجام می گیرد. سپس این عکس در تصویر مقیاس خاکستری ورودی ادغام می شود. نتیجه حاصل یک تصویر فشرده در مقیاس خاکستری می باشد که فقط قسمت های شامل پوست را نشان می دهد. نتیجه در شکل ۲-۶ نشان داده شده است.

برای بهبود بخشیدن کنتراست ، یک هیستوگرام روی عکس خاکستری حاصله از مرحله قبل انجام می گیرد. این کار کمک می کند تا ناحیه های تاریک و روشن در رنج های قابل پیش بینی بیشتری قرار گیرند و تا حدی تاثیر روشنائی در تصویر جبران شود. حالا می توان تصویر را برای جدا کردن تیره ترین و روشن ترین نقاط آستانه گیری نمود. تجربه نشان می دهد که مرز آستانه قابل قبول به گونه ای است که به تمام پیکسل های دارای مقدار بین ۹۵ تا ۲۴۰ مقدار ۱ نسبت دهد و بقیه پیکسل های کمتر یا بیشتر مقدار ۰ می گیرند. برای بیشتر عکس های آزمایش شده، این روش قابل قبول بوده است. سپس این تصویر باینری تولید شده برچسب گذاری می شود و حاصل یک تصویر مثبت[۱۱]است که نواحی پوست را به طور مجزا نشان می دهد.

سپس یک تصویر منفی[۱۲] تولید می شود که فقط سوراخ ها را به عنوان یک شی نشان می دهد. بستن سوراخ های تصویر باینری تولید شده در مرحله قبل به وسیله یک عنصر گرد ۴*۴ انجام می شود. نتیجه از عکس باینری اصلی کم می شود و حاصل فقط سوراخ ها را نشان می دهد.

عکس منفی و مثبت با هم به کار برده می شوند تا اجزائی که احتمال دارند صورت باشند پیدا شوند. در ابتدا سوراخ های عکس منفی با سایز ۱ پیکسل برداشته می شوند. زیرا این سوراخ ها غیر عادی و بی ربط می باشند. یک تکنیک نسبتا بهتر این است که تمام سوراخ ها به جز سه سوراخ بزرگتر را از تصویر بر می دارد. سپس سوراخ ها گسترش داده می شوند و حاصل در تصویر مثبت ادغام می شود. حاصل تصویری است که در آن پیکسل های اطراف یک سوراخ نمایش داده می شوند و به دلیل این که عکس مثبت برچسب گذاری شده است، برنامه به راحتی می تواند معین کند که کدام نواحی سوراخ دارند و کدام ندارند. یک تابع ساده ارقام ظاهر شده در مجاورت سوراخ ها را محاسبه می کند. تصویر نهائی حاصله شامل اجزا برچسب گذاری با این مقادیر می باشد.

به دلیل این که این پروسه فقط بر مبنای پیدا کردن سوراخ ها می باشد. شانس بیشتری در پیدا کردن صورت ها علیرغم وجود پرسپکتیو دارد. یکی از بزرگترین معایب این روش این است که احتمال زیادی برای تشخیص اشیا (به جز صورت ) به عنوان صورت هم وجود دارد. نتایج نشان می دهد که عملیات هنگامی به خوبی انجام می شود که صورت فضای بیشتری از تصویر را اشغال کرده باشد. مشکل دیگر این روش این است که اگر افراد داخل تصویر کاملا لباس نپوشیده باشند، قسمت های زیادی به عنوان پوست در نظر گرفته می شوند و در تصویر حاصله تمام سر، دست ها و نیمتنه بالا به عنوان یک جز در نظر گرفته می شوند.

۲-۲ : الگوریتم تشخیص صورت بر مبنای مکان یابی ویژگی های صورت

مقدمه

تشخیص صورت انسان اغلب به عنوان اولین قدم در کاربردهائی مثل نظارت ویدئوئی، رابطه انسان کامپیوتر، شناسائی صورت و مدیریت پایگاه تصویر می باشد. این روش شامل یک الگوریتم برای تصاویر رنگی می باشد که با وجود شرایط مختلف نور و پس زمینه های متفاوت نتایج خوبی ارائه می دهد.

این متد نواحی پوست را در تمام تصویر مشخص نموده، سپس کاندید های صورت را بر مبنای روابط فضائی نواحی پوست ایجاد می کند. سپس نقشه چشم، دهان و مرز صورت را برای بررسی هر ناحیه که به عنوان کاندیدی از یک صورت می باشد، می سازد. نتایج تجربی حاکی از موفقیت این الگوریتم در تشخیص صورت روی تعداد زیادی از تصاویر که در زمینه رنگ، موقعیت، مقیاس، چرخش، وضعیت و حالات چهره تفاوت دارند و از منابع مختلفی تهیه شده اند، می باشد.

۲-۲-۱ : چکیده

روش های مختلف تشخیص صورت که از تکنیک هائی مثل شبکه های عصبی، آموزش ماشین،‌ تطبیق مدل های تغییر پذیر، تبدیل Hough ، استخراج حرکت و آنالیز رنگ استفاده می کنند، در [۴] بیان شده اند. روش های مبتنی بر شبکه عصبی [۵] و تصویر[۶] به تعداد زیادی از نمونه های آموزشی شامل صورت و غیر صورت نیاز دارند و برای پیدا کردن صورت در تصاویر مقیاس خاکستری طراحی شده اند. در جدید ترین متد مبتنی بر تصویر [۷] با استفاده از تکنیک پارامتری تشخیص صورت از حالت تمام رخ به نیم رخ ارتقا داده شده است. روش های مبتنی بر مدل به طور گسترده در ردیابی صورت استفاده می شود، اغلب در این روش ها فرض بر این است که مکان اولیه صورت معین می باشد.

رنگ پوست یک راهنمای مهم در زمینه تشخیص صورت می باشد. اما روش های مبتنی بر رنگ با وجود پس زمینه های مختلط و تغییرات شرایط نوری به مشکل بر می خورند. روشی که در ادامه بیان می شود می تواند به خوبی از عهده تمام مسائل فوق برآید.

۲-۲-۲ : الگوریتم تشخیص صورت

به کارگیری اطلاعات رنگ مکان یابی صورت در فضای مرکب و مختلط را آسان می سازد

[۴ , ۸]. شکل ۲-۱۰ توضیح اجمالی از الگوریتم این روش را بیان می کند، این شکل شامل دو قسمت اصلی می باشد :

۱ ) مکان یابی صورت برای پیدا کردن نواحی کاندید صورت

۲ ) تشخیص ویژگی های مربوط به صورت برای بررسی نواحی معین شده در مرحله قبل

۲-۲-۳ : جبران سازی نور و تشخیص رنگ و تن پوست

رنگ پوست نمایش داده شده در تصویر در اثر شرایط مختلف نوری تغییر می کند. به منظور جبران این پدیده از سفید مرجع[۱۳] برای نرمالیزه کردن رنگ استفاده می شود. پیکسل هائی با ۵% بالا ترین مقدار لوما[۱۴] به عنوان سفید مرجع در نظ گرفته می شود، اگر تعداد این پیکسل های سفید مرجع از ۱۰۰ بیشتر باشد. برای تنظیم اجزا R، G و B یک تصویر رنگی، پیکسل های سفید مرجع به سطح خاکستری ۲۵۵ مقیاس می گردند. برای مدل کردن رنگ پوست باید فضای رنگی مناسب و یک گروه مرتبط با رنگ پوست در این فضا انتخاب شود. بر اساس مقایسه ای که در مورد فضاهای رنگی کاربردی در زمینه تشخیص صورت توسط Terrilon [۹]صورت گرفته، در این روش از فضای رنگی ycbcr که به طور گسترده در استاندارد های فشرده سازی ویدیوئی کاربرد دارد، استفاده شده است. از آن جائی که رنگ پوست به نور[۱۵] وابسته می باشد، در این روش فضای ycbcr به طور غیر خطی تغییر داده شده تا فضای رنگ مستقل از لوما را تولید کند. دیگر مزیت آن این است که باعث می شود تا پوست های با رنگ تیره و روشن هم به طور کامل تشخیص داده شوند. از یک مدل بیضی پارامتری در زیر فضای رنگی cb , cr به عنوان مدلی برای رنگ پوست استفاده شده است. شکل ۲-۱۱ یک نمونه از تشخیص پوست با این روش را نمایش می دهد.

۲-۲-۴ : مکان یابی ویژگی های مربوط به صورت

در میان ویژگی های مختلف صورت، چشم ها و دهان مناسب ترین خصیصه ها برای شناسائی و تخمین وضعت های سه بعدی می باشند [۱۰]. بیشتر روش های مکان یابی چشم و صورت [۱۲ , ۱۱] بر مبنای مدل می باشند،‌اما این روش قادر است که مکان چشم ها، دهان و مرز صورت را بر مبنای مقادیری که از عناصر فضای رنگی یک تصویر استخراج می کند به طور مستقیم مشخص می کند.

آنالیز عناصر رنگی[۱۶] نشان می دهد که مقادیر بالای cb و پایین cr در اطراف چشم ها و مقادیر بالای cr در اطراف دهان پیدا می شوند. علاوه بر این، چشم ها معمولا حاوی تاریکترین و تیره ترین پیکسل ها در عنصر لوما می باشند. بر مبنای این مشاهدات، ‌توابع مورفولوژیکی مقیاس خاکستری مثل گسترش[۱۷] و کاهش [۱۸]برای تاکید روی پیکسل های روشن تر و تاریک تر عنصر لوما در اطراف چشم ها به کار برده می شوند [۱۳]. این توابع به منظور ساختن بردار های ویژگی برای یک صورت کامل در مقیاس های مختلف صورت تمام رخ به کاربرده می شود [۱۴]. در الگوریتم تشخیص چشم،‌ توابع گسترش و کاهش که از یک عنصر نیم کره یا نیم دایره[۱۹] با مقیاس تخمین زده شده استفاده می کند،‌ برای ساختن نقشه چشم در حالت لوما به طور مستقل به کاربرده می شوند. نقشه چشم در حالت رنگ از cb ، معکوس cr و نسبت cb/cr تولید می شود. دو نقشه حاصله در هم ادغام شده و در نقشه نهائی همان طور که در شکل۲-۱۲ نشان داده شده، دو چشم روشن تر نمایش داده می شود و دیگر نواحی صورت تاریک می باشد.

سپس کاندید های چشم طی دو مرحله که در ادامه شرح داده می شود انتخاب می گردند. مرحله اول شامل تجزیه هرمی نقشه گسترش یافته چشم برای مکان یابی های اشتباه و مرحله دوم شامل بستن[۲۰] و آستانه گیری روی نقشه گسترش یافته برای مکان یابی های صحیح چشم می باشد. ناحیه دهان شامل عنصر قرمز بیشتر و عنصر آبی کمتر نسبت به دیگر نواحی صورت می باشد. از این رو در ناحیه دهان عنصر cr از cb بزرگتر می باشد. علاوه بر این،‌لازم به ذکر است که نسبت cr/cb در نزدیک دهان کم تر و cr² بالاتر می باشد. بنابراین تفاوت بین cr²و cr/cb می تواند بر روی ناحیه دهان تاکید داشته باشد. شکل ۲-۱۳ نقشه های مربوط به مکان یابی دهان تصویر نشان داده شده در شکل۲-۱۲ را نمایش می دهد.

کاندید های چشم و دهان در زمینه سه گزینه زیر مورد بررسی قرار می گیرند :

۱)تغییرات لوما در ناحیه چشم و دهان

۲) محدودیت های جهت و هندسی مثلث دهان- چشم

۳) وجود داشتن یک مرز اطراف مثلث دهان- چشم

در این الگوریتم در ابتدا بر مبنای مکان کاندید های چشم – دهان یک نقشه مرز صورت در مولفه لوما ساخته می شود. سپس تبدیل Hough برای بیرون کشیدن مناسب ترین بیضی به کاربرده می شود. این بیضی متناسب با سنجش استفاده شده برای محاسبه وزن مثلث دهان – چشم می باشد. شکل ۲-۱۴ نقشه مرزی را نشان می دهد که از اجزا اندازه و جهت گرادیان لوما درون نواحی که جهت های مثبت چرخش گرادیان را دارا هستند ساخته می شود. تبدیل Hough برای تشخیص اشکال پارامتری مفید می باشد و کارائی آن به ابعاد جمع کننده بستگی دارد. یک بیضی در یک سطح دارای پنج پارامتر می باشد :

۱ ) زاویه چرخش

۲،۳ ) دو مولفه مختصات مرکز

۴،۵ ) طول کوچکترین و بزرگترین محور.

ازآن جائی که مکان چشم ها و دهان مشخص می باشد،‌ چرخش بیضی به وسیله جهت برداری که از نقطه میانی بین چشم ها و دهان آغاز می شود تخمین زده می شود.

مکان مرکز بیضی هم به وسیله مرز صورت تخمین زده می شود. از این رو،‌ فقط یک جمع کننده دو بعدی برای یک بیضی در یک سطح مورد نیاز می باشد. بیضی هر کاندید مثلث دهان – چشم در ارتباط با نقشه دهان – چشم، جهت صورت در مقایسه با صورت های عمودی و نقشه متناسب با ویژگی های صورت می باشد [۱۵] .

نتایج اجرای این الگوریتم بر روی تصاویر HHI MPEG7 [16] و مجموعه تصاویر Champion Data [۱۷] در سایت معرفی شده در مرجع ]۱۸[ در دسترس می باشد.

۵-۲-۲ : نتایج

در این روش یک الگوریتم تشخیص صورت برای تصاویر رنگی که از یک مدل رنگ پوست و ویژگی های صورت استفاده می کند به کاربرده شد. این متد در ابتدا رنگ تصویر را به وسیله متد جدید جبران سازی نور که به طور اتوماتیک پیکسل های سفید مرجع را تخمین می زند، تصحیح می کند. در این روش با استفاده از یک تبدیل غیر خطی در فضای رنگی ycbcr بر تاثیرات لوما غلبه شده است. این متد نواحی پوست را در کل تصویر مشخص نموده، سپس کاندیدهای صورت را بر مبنای روابط فضائی قطعات پوست ایجاد می کند. این الگوریتم نقشه های مرز، دهان و چشم را برای بررسی هر کدام از کاندید های صورت می سازد. هدف این روش این است که سیستم هائی را طراحی کند که صورت ها و ویژگی های مربوط به صورت را تشخیص دهد و کاربران بتوانند صورت ها را ویرایش کرده و ویژگی های صورت را برای بازیابی آن به کار برند [۱۸].

۲-۳: یک متد آماری برای تشخیص اجسام سه بعدی

تمام مقالات و پایان نامه و پروژه ها به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد.

جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.

مطالب پیشنهادی:

پاورپوینت آینده دیجیتال چاپ

مقاله الگوریتم های تشخیص لبه در تصاویر

پایان نامه Antialiasing یا لبه دارشدن لبه‌ی تصویر دیجیتال

مقاله پردازشگرهای دیجیتال یا (DSP)

مقاله پل سزان