|
جستارهای زبانی، جلد ۱۴، شماره ۲، صفحات ۳۱۱-۳۴۱
|
|
|
عنوان فارسی |
ارتقاء و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با بکارگیری ویژگیهای خط فارسی و الگوریتم انتقال فضا |
|
چکیده فارسی مقاله |
از آنجا که فنآوری بازشناسی نوری حروف اصالتاً بر پایه ویژگیهای خطی لاتین بنا شده است، تقریباً کلیه الگوریتمها و مراحل مورد استفاده در نظامهای رایج بازشناسی حروف فارسی نیز بر اساس همان ساختار و ویژگیهای خطوط لاتین گسترش یافتهاند. بکارگیری ابزار و ویژگیهای خطوط لاتین در طراحی نظامهای فارسی محور، نه تنها در نهایت به انجام بازشناسی صحیح حروف فارسی منجر نگردیده است، بلکه باعث سردرگمی همزمان نرمافزار و کاربر فارسیزبان نیز شده است. از اینرو، در اینجا، پس از مقدمهای کوتاه پیرامون اهمیت خط و زبان در حوزه فنآوری اطلاعات به سیر تحول خط فارسی در دورههای مختلف و شرح ویژگیهای این خط و تفاوتهای آن با خطوط دیگر پرداخته شده است و عناصر شکلی این خط، با توجه به کاربرد و اهمیت آنها در تعامل کاربر با نرمافزارهای بازشناسی نوری متون فارسی، طیقهبندی گردیده است. در این بخش، با توصیف و تحلیل مراحل بازشناسی حروف بر اساس ویژگیهای خط فارسی و شرح تفاوتهای آن با گونههای لاتین محور موجود، چهرهای متفاوت از دستگاه خط فارسی به هنگام کار با رایانهها و به ویژه در سیستمهای بازشناسی نوری حروف عرضه میشود بطوری که مخاطب عملاً قابلیت و ظرفیتهای دستگاه خط فارسی در هماوردی با دستگاه ساده خط لاتین را مشاهده خواهد نمود. با اتکا به همین ویژگیها، در جهت ارتقاء و اصلاح الگوریتمهای رایج در بازشناسی نوری حروف فارسی، تسهیل بکارگیری الگوها، و تعدیل حجم پایگاه دادهها، از فرایند انتقال هندسی فضای دو بعدی به تک بعدی نیز بهره جستهایم. |
|
کلیدواژههای فارسی مقاله |
بازشناسی نوری حروف،اُ.سی.آر،الگوریتم انتقال فضا نظام،نگارشی زبان فارسی،ویژگیهای خطی فارسی |
|
عنوان انگلیسی |
Correction and Improvement of the Common Processes in Optical Character Recognition (OCR) of Persian Texts: Using the Features of the Persian Script and a Dimension Transference Algorithm |
|
چکیده انگلیسی مقاله |
Since the technology of optical recognition of characters is essentially based on Latin script, almost all the algorithms and processes involved in the Persian OCR systems are constructed upon the structure and scriptological features of Latin alphabet. This utilization of the means and features of Latin script in order to design Persian-based OCR systems, however, not only has not resulted in the appropriate optical recognition of Persian characters but also has simultaneously ended in confusion on the part of both the Persian-speaking users and the systems. Through a step by step discussion and analysis of the processes involved in the optical recognition of characters based on the scriptological features of the Persian script, not only the deficiencies and faults of the current Latin-based OCR systems will be pinpointed but also a different aspect of the Persian writing system, in connection with its use in computer software, especially OCR systems, will be drawn so that the reader will practically notice the potentials and capabilities of this complex script in contrast to the simpler Latin writing system. In the end, in order to upgrade and improve the current algorithms employed in Persian OCR systems, the geometrical process of transferring bi-dimensional specifications into mono-dimensional ones has been utilized. The proposed algorithm, which is based on the scriptological features of the Persian script, will simultaneously result in the convenient manipulation of patterns, reduction of the bulk of the database, and acceleration of the data processing rate. |
|
کلیدواژههای انگلیسی مقاله |
Optical character recognition,OCR,Computational linguistics,Scribal features,Persian writing system |
|
نویسندگان مقاله |
آرش زارعیان | Arash Zareian Payame Noor University دانشگاه پیام نور
طیبه موسوی میانگاه | Tayebeh Mosavi Miangah Payame Noor University دانشگاه پیام نور
بلقیس روشن | Belghis Rovshan Payame Noor University دانشگاه پیام نور
سید مصطفی فخر احمد | seyyed Mostafa Fakhr Ahmad Shiraz University دانشگاه شیراز
|
|
نشانی اینترنتی |
http://lrr.modares.ac.ir/browse.php?a_code=A-10-64065-1&slc_lang=fa&sid=14 |
فایل مقاله |
فایلی برای مقاله ذخیره نشده است |
کد مقاله (doi) |
|
زبان مقاله منتشر شده |
fa |
موضوعات مقاله منتشر شده |
|
نوع مقاله منتشر شده |
مقالات علمی پژوهشی |
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|