OCR-vs-Image-format

تفاوت OCR و اسکن یک سند متنی به صورت عکس

چه تفاوتی میان OCR (تشخیص کاراکتر) و اسکن یک سند با فرمت خروجی ای مانند یک فایل عکس وجود دارد؟ برای درک بیشتر این موضوع بهتر است توضیحی درباره هر دو  (اسکن به صورت فایل عکسی و OCR) فرمت خروجی تعریف کنیم.

اسکن یک سند و تبدیل آن به صورت عکس (tiff ، Jpeg ، gif و …)

اسکن یک سند متنی و ذخیره آن مانند یک فرمت عکس (tiff ، Gif ، Jpg و …) دقیقا مانند این است که از سند متنی خود توسط دوربین عکسی گرفته باشید یا اینکه با استفاده از دستگاه های کپی از آن کپی تهیه کرده باشید، اما اگر مایل هستید که بعد از اسکن به متن های داخل سندی که اسکن کرده اید در نرم افزارهای ویرایشگر متن مانند Microsoft Word دسترسی داشته باشید باید حتما بعد از اسکن عملیات OCR را بر روی فایل خود توسط نرم افزارهای مخصوص اجرا کرده و آن را از فرمت عکس به فرمت متن قابل ویرایش تبدیل کنید.

Optical Character Recognition تشخیص کاراکتر نوری

OCR در اصل نرم افزار یا سخت افزاری است که برای تشخیص متن از سندهای چاپی طراحی شده است. این تکنولوژی قابلیت این را دارد که اسناد اسکن شده را به متن های قابل ویرایش در کامپیوتر و سایر دستگاه های مشابه تبدیل نماید. نرم افزارها و یا سخت افزارهای OCR در اصل بگونه ای عمل می کند که ابتدا قسمت های مختلف سند (قسمت های متنی، قسمت های جدول، قسمت های عکس و ..) را بررسی کرده و پس از آن اقدام به تبدیل آن به فرمت قابل ویرایش می کنند.

لپ مطلب

بعد از اسکن یک سند متنی، به صورت معمول آن سند به یک فرمت غیرقابل ویرایش (عکس) تغییر پیدا می کند اما اگر نیاز دارید که یک سند متنی را اسکن و بعد از آن به متن های درون آن دسترسی داشته باشید یا به گونه ای دیگر اگر نیاز دارید قسمتی از متن های درون یک سند چاپی را بگونه ای استفاده کنید و آن را ویرایش کنید و طراحی و تایپ مجدد آن زمان زیادی را از شما می گیرد، می توانید بعد از اسکن فایل خروجی خود را با نرم افزارهای OCR مربوطه به متن های قابل ویرایش تبدیل کنید.