جستارهای زبانی، جلد ۱۴، شماره ۲، صفحات ۳۱۱-۳۴۱

عنوان فارسی ارتقاء و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با بکارگیری ویژگی‌های خط فارسی و الگوریتم انتقال فضا
چکیده فارسی مقاله از آنجا که فن­آوری بازشناسی نوری حروف اصالتاً بر پایه ویژگی‌های خطی لاتین بنا شده است، تقریباً کلیه الگوریتم‌ها و مراحل مورد استفاده در نظام‌های رایج بازشناسی حروف فارسی نیز بر اساس همان ساختار و ویژگی‌های خطوط لاتین گسترش یافته‌اند. بکارگیری ابزار و ویژگی‌های خطوط لاتین در طراحی نظام‌های فارسی محور، نه تنها در نهایت به انجام بازشناسی صحیح حروف فارسی منجر نگردیده است، بلکه باعث سردرگمی همزمان نرم‌افزار و کاربر فارسی‌زبان نیز شده است. از اینرو، در اینجا، پس از مقدمه‌ای کوتاه پیرامون اهمیت خط و زبان در حوزه فن‌آوری اطلاعات به سیر تحول خط فارسی در دوره‌های مختلف و شرح ویژگی‌های این خط و تفاوت‌های آن با خطوط دیگر پرداخته شده است و عناصر شکلی این خط، با توجه به کاربرد و اهمیت آنها در تعامل کاربر با نرم‌افزارهای بازشناسی نوری متون فارسی، طیقه‌بندی گردیده است. در این بخش، با توصیف و تحلیل مراحل بازشناسی حروف بر اساس ویژگی‌های خط فارسی و شرح تفاوتهای آن با گونه‌های لاتین محور موجود، چهره‌ای متفاوت از دستگاه خط فارسی به هنگام کار با رایانه‌ها و به ویژه در سیستم‌های بازشناسی نوری حروف عرضه می‌شود بطوری که مخاطب عملاً قابلیت و ظرفیت‌های دستگاه خط فارسی در هماوردی با دستگاه ساده خط لاتین را مشاهده خواهد نمود. با اتکا به همین ویژگی‌ها، در جهت ارتقاء و اصلاح الگوریتم‌های رایج در بازشناسی نوری حروف فارسی، تسهیل بکارگیری الگوها، و تعدیل حجم پایگاه داده‌ها، از فرایند انتقال هندسی فضای دو بعدی به تک بعدی نیز بهره جسته‌ایم.
کلیدواژه‌های فارسی مقاله بازشناسی نوری حروف،اُ.سی.آر،الگوریتم انتقال فضا نظام،نگارشی زبان فارسی،ویژگی‌های خطی فارسی

عنوان انگلیسی Correction and Improvement of the Common Processes in Optical Character Recognition (OCR) of Persian Texts: Using the Features of the Persian Script and a Dimension Transference Algorithm
چکیده انگلیسی مقاله Since the technology of optical recognition of characters is essentially based on Latin script, almost all the algorithms and processes involved in the Persian OCR systems are constructed upon the structure and scriptological features of Latin alphabet. This utilization of the means and features of Latin script in order to design Persian-based OCR systems, however, not only has not resulted in the appropriate optical recognition of Persian characters but also has simultaneously ended in confusion on the part of both the Persian-speaking users and the systems. Through a step by step discussion and analysis of the processes involved in the optical recognition of characters based on the scriptological features of the Persian script, not only the deficiencies and faults of the current Latin-based OCR systems will be pinpointed but also a different aspect of the Persian writing system, in connection with its use in computer software, especially OCR systems, will be drawn so that the reader will practically notice the potentials and capabilities of this complex script in contrast to the simpler Latin writing system. In the end, in order to upgrade and improve the current algorithms employed in Persian OCR systems, the geometrical process of transferring bi-dimensional specifications into mono-dimensional ones has been utilized. The proposed algorithm, which is based on the scriptological features of the Persian script, will simultaneously result in the convenient manipulation of patterns, reduction of the bulk of the database, and acceleration of the data processing rate.
کلیدواژه‌های انگلیسی مقاله Optical character recognition,OCR,Computational linguistics,Scribal features,Persian writing system

نویسندگان مقاله آرش زارعیان | Arash Zareian
Payame Noor University
دانشگاه پیام نور

طیبه موسوی میانگاه | Tayebeh Mosavi Miangah
Payame Noor University
دانشگاه پیام نور

بلقیس روشن | Belghis Rovshan
Payame Noor University
دانشگاه پیام نور

سید مصطفی فخر احمد | seyyed Mostafa Fakhr Ahmad
Shiraz University
دانشگاه شیراز


نشانی اینترنتی http://lrr.modares.ac.ir/browse.php?a_code=A-10-64065-1&slc_lang=fa&sid=14
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده مقالات علمی پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات