دوره 14، شماره 2 - ( 1402 )                   جلد 14 شماره 2 صفحات 341-311 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Zareian A, Mosavi Miangah T, Rovshan B, Fakhr Ahmad S M. Correction and Improvement of the Common Processes in Optical Character Recognition (OCR) of Persian Texts: Using the Features of the Persian Script and a Dimension Transference Algorithm. LRR 2023; 14 (2) :311-341
URL: http://lrr.modares.ac.ir/article-14-53265-fa.html
زارعیان آرش، موسوی میانگاه طیبه، روشن بلقیس، فخر احمد سید مصطفی. ارتقاء و اصلاح فرایندهای رایج در بازشناسی نوری حروف متون فارسی با بکارگیری ویژگی‌های خط فارسی و الگوریتم انتقال فضا. جستارهای زبانی 1402; 14 (2) :341-311

URL: http://lrr.modares.ac.ir/article-14-53265-fa.html


1- دانشگاه پیام نور
2- دانشگاه پیام نور ، mosavit@pnu.ac.ir
3- دانشگاه شیراز
چکیده:   (840 مشاهده)
از آنجا که فن­آوری بازشناسی نوری حروف اصالتاً بر پایه ویژگی‌های خطی لاتین بنا شده است، تقریباً کلیه الگوریتم‌ها و مراحل مورد استفاده در نظام‌های رایج بازشناسی حروف فارسی نیز بر اساس همان ساختار و ویژگی‌های خطوط لاتین گسترش یافته‌اند. بکارگیری ابزار و ویژگی‌های خطوط لاتین در طراحی نظام‌های فارسی محور، نه تنها در نهایت به انجام بازشناسی صحیح حروف فارسی منجر نگردیده است، بلکه باعث سردرگمی همزمان نرم‌افزار و کاربر فارسی‌زبان نیز شده است. از اینرو، در اینجا، پس از مقدمه‌ای کوتاه پیرامون اهمیت خط و زبان در حوزه فن‌آوری اطلاعات به سیر تحول خط فارسی در دوره‌های مختلف و شرح ویژگی‌های این خط و تفاوت‌های آن با خطوط دیگر پرداخته شده است و عناصر شکلی این خط، با توجه به کاربرد و اهمیت آنها در تعامل کاربر با نرم‌افزارهای بازشناسی نوری متون فارسی، طیقه‌بندی گردیده است. در این بخش، با توصیف و تحلیل مراحل بازشناسی حروف بر اساس ویژگی‌های خط فارسی و شرح تفاوتهای آن با گونه‌های لاتین محور موجود، چهره‌ای متفاوت از دستگاه خط فارسی به هنگام کار با رایانه‌ها و به ویژه در سیستم‌های بازشناسی نوری حروف عرضه می‌شود بطوری که مخاطب عملاً قابلیت و ظرفیت‌های دستگاه خط فارسی در هماوردی با دستگاه ساده خط لاتین را مشاهده خواهد نمود. با اتکا به همین ویژگی‌ها، در جهت ارتقاء و اصلاح الگوریتم‌های رایج در بازشناسی نوری حروف فارسی، تسهیل بکارگیری الگوها، و تعدیل حجم پایگاه داده‌ها، از فرایند انتقال هندسی فضای دو بعدی به تک بعدی نیز بهره جسته‌ایم.
     
نوع مقاله: مقالات علمی پژوهشی | موضوع مقاله: زبان شناسی
انتشار: 1402/3/10

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.