OCR فارسی

مبدل او سی آر OCR فارسی | تبدیل عکس به متن فارسی آنلاین

+ هزینه پایین + انجام خدمات تبدیل برای افراد شخصی و سازمانی  + کیفیت بالای تبدیل عکس به متن + مکانیزم ارسال و دریافت آنلاین

او سی آر OCR چیست

به ساده ترین حالت ممکن اگر بخواهیم اوسی آر OCR  (Optical Character Recognition ) را توضیح دهیم می توان به نرم افزار یا سخت افزاری گفت که پس از پردازش تصاویر متون داخل آن را استخراج می کند. حال اینکه چرا کلا به اوسی آر نیاز است می تواند هزاران دلیل داشته باشد ولی اصلی ترین آن جلوگیری از هدررفت زمان برای تایپ مجدد صفحه ای است که از قبل توسط دست یا کامپیوتر نوشته ( یا تایپ) شده است.

تبدیل عکس به متن

سامانه اوسی آر فارسی دقیقا چه کاری انجام می دهد؟ به طور خلاصه تصاویر اسکن (ایجاد) شده توسط دوربین های دیجیتال یا اسکنرها که حاوی متن هستند در نرم افزار یا سخت افزار مورد پردازش قرار می گیرند، نرم افزار او سی آر این وظیفه را بر عهده می گیرد که بیت به بیت (جز به جز) تصویر ورودی را مورد بررسی و آنالیز قرار بدهد سپس با استفاده از الگوریتم و هوش مصنوعی که توسط طراح نرم افزار او سی آر طراحی شده متون درون تصویر را استخراج کند. بعضی از نرم افزارها علاوه بر متن با قدرت آنالیز خود می توانند سایر موارد همچون تصاویر، جداول، فرمول ها، صفحه آرایی، نوع و سایز فونت و … را تشخیص و در فایل خروجی که می تواند از نوع نوشته (txt) یا ورد(doc , docx , dot) یا پی دی اف قابل جستجو (Searchable Pdf, PDF) یا … باشد، اعمال کنند.

سختی های و پیچیده های تبدیل ماشینی فارسی یا همان او سی آر فارسی

اگر به زبان های دیگر مانند انگلیسی دقت کنید متوجه خواهید شد که در الفبای آن حروف یا اعداد از نظر نوشتاری با هم تفاوت های زیادی دارد همچنین مانند زبان فارسی حروف کمتر چندین شکل دارد ولی این در زبان فارسی این مورد صدق نمی کند به طور مثال به (ز ژ ر یا ب پ ت ث) دقت کنید فقط حذف یک نقطه می تواند “ث” را به “ت” یا “ز” را به “ر” تبدیل کند این مورد در اعداد نیز صدق می کند (“۲” “۳” ) فقط با یک دندانه از هم متمایز می شوند،

غیر از شبیه بودن حروف مسئله دیگری که می توان دلیل بر سختی اوسی آر فارسی باشد چسبیده شدن کلمات است به طور مثال (“ب” “به” “بی” “با”) ؛ مورد دیگه ای که وجود دارد کشیده شدن حروف است به این مثال توجه کنید (“سی” “سـی” “ســی) هر سه مورد نوشته شده از نظر ما “سی” هستند ولی این برای نرم افزار او سی آر فارسی یک “س” چسبان و یک یا چند “ـ”  است یکم که دقیق تر بشویم این کاراکتر شبیه خط فاصله “-” است ولی باید گفت که این دو باهم متفاوت است.  البته موارد دیگری نیز هستند که باعث سخت شدن تبدیل ماشینی یا OCR فارسی می شوند. مواردی که در بالا گفته شد جزو اصلی ترین آن ها است. همین موارد آنالیز زبان فارسی یا به گفتاری دیگر OCR فارسی را سخت کرده است. البته با گذشت زمان و روی کار آمدن مواردی  مانند اسکنرهای با کیفیت تر، هوش مصنوعی دقیق تر، و الگوریتم های قوی تر این موارد نیز کم کم در حال رفع و تصحیح است و راه برای تبدیل عکس فارسی به متن قابل ویرایش ( OCR) روان و روان تر می شود.

انواع- اسناد

معمولا OCR می شوند:

  • صفحات کتاب
  • اسناد
  • مجلات
  • مقالات چاپ شده
  • جزوات تایپ شده
  • روزنامه ها
  • صورت حساب ها
  • فرم های آمار مشتری
  • نسخه های خطی
  • پی دی اف غیرقابل ویرایش
  • تصاویر حاوی متن
  • تبدیل بطور معمول به :
  • ورد doc
  • ورد ورژن بالا docx
  • اسناد آفیس doc
  • پی دی اف pdf
  • پی دی اف قابل جستجو
  •  searchable pdf
  • متن txt
  • کیفیت او سی آر رابطه مستقیم با کیفیت فایل اسکن شده دارد برای دریافت خروجی بهتر تصاویر با کیفیت بالا ارسال فرمایید.
  • در صورتی که فایل در دسترس باکیفیت نیست می توانید اصل کار را برای ما ارسال تا با کیفیت بالا اسکن شود (لیست قیمت اسکن)
  • مدت زمان تبدیل از ۱ ساعت تا ۵ ساعت بستگی به شلوغی و … دارد البته همواره سعی می شود در کمترین زمان ممکن تبدیل انجام شود.
  • ارسال فایل از طریق تلگرام، واتساپ، سروش، پشتیبانی آنلاین سایت، آپلود و ارسال لینک و … امکان پذیر می باشد.
  • تسویه هزینه به صورت آنلاین یا کارت به کارت یا فیش بانکی امکان پذیر می باشد.
  • لطفاً قبل از درخواست تبدیل نمونه ها را مشاهده کنید چرا که وجه قابل استرداد نمی باشد.

سوالات پرتکرار مشتریان در مورد او سی آر (OCR)

آیا تیم دیجیتال داک خدمات تبدیل پی دی اف فارسی به ورد را نیز انجام میدهد؟

بله هزینه این تبدیل برابر با هزینه او سی آر است. ارسال فایل و تسویه حساب نیز بدون مراجعه حضوری امکان پذیر است.

آیا متن دست نویس فارسی نیز امکان او سی آر دارد؟

قطعا در آینده نزدیک بله؛ ولی در حاضر الگورتیم های موجود دقت نسبتا بالایی ندارند و تبدیل با خطاهایی زیادی همراه است.

آیا امکان تبدیل متن های دو یا چند زبانه وجود دارد؟ اگر دارد هزینه جداگانه ای دارد؟

بله این امکان وجود دارد، خیر هزینه دیگری ندارد.

چرا این سیستم را به صورت آنلاین در دسترس نیست تا در هر ساعت شبانه روز قابل استفاده باشد؟

با توجه به اینکه او سی آر فارسی هنوز در نیمه های راه است که بتواند هوش ماشینی بالایی داشته باشد و افراد با سطح دانش کم نیز از آن بهره بگیرند و به دلیل رضایت بیشتر مشتریان، فعلا این سیستم به صورت آفلاین است، البته تیم پشتیبانی دیجیتال داک همواره سعی می کند در کوتاه ترین زمان ممکن فایل های مشتریان را با بالاترین کیفیت تبدیل نماید.

فایل های ارسالی با چه فرمتی قابل قبول و ارسال است؟

تمامی فایل های با پسوند تصویر و متن قابل ارسال می باشد.مثل jpg , png, gif , pdf , doc, docx

آیا می توانم هم زمان دو پسوند فایل خروجی درخواست کنم؟ اگر بله هزینه آن چقدر است؟

هزینه درخواست ۲ پسوند خروجی برای هر فایل بدون اهمیت داشتن تعداد صفحات برای خروجی دوم ۵ هزار تومان است

مدت زمان انجام OCR فارسی  چقدر است؟

از ۱ ساعت تا ۵ ساعت بستگی به شلوغی و … دارد البته همواره سعی می شود در کمترین زمان ممکن تبدیل انجام شود.

برای کسب اطلاعات بیشتر در مورد روش ها و راه حل های OCR و دیگر مسائلی که فکر می کنید ما می توانیم در آن به شما کمک کنیم همین حالا با استفاده از این فرم با ما تماس بگیرید