Optical Character အသိအမှတ်ပြု (OCR) ကဘာလဲ?

Optical Character အသိအမှတ်ပြု (OCR) ကွန်ပျူတာများကို manually စာသားကိုရိုက်ထည့်ဒါမှမဟုတ်ရိုက်ထည့်ရန်လိုအပ်ကြောင်းမပါဘဲဖတ်နိုင်မယ့်ပုံနှိပ်, ရိုက်, သို့မဟုတ်လက်ရေး document ရဲ့ဒစ်ဂျစ်တယ်ဗားရှင်းဖန်တီးပေးတဲ့ဆော့ဗ်ဝဲကိုရည်ညွှန်းသည်။ OCR ယေဘုယျအားဖြင့်ထဲမှာ Scan စာရွက်စာတမ်းများပေါ်တွင်အသုံးပြုသည် ကို PDF format နဲ့, ဒါပေမယ့်လည်းတစ်ဦး image file ကိုအတွင်းစာသားကွန်ပျူတာ-ဖတ်လို့ရအောင်ဗားရှင်းဖန်တီးနိုင်ပါတယ်။

OCR ကဘာလဲ?

OCR လည်းစာသားမအသိအမှတ်ပြုမှုအဖြစ်ရည်ညွှန်းပိုမိုလွယ်ကူစွာကွန်ပျူတာနှင့်တခြားဆော့ဗ်ဝဲပရိုဂရမ်များကအသိအမှတ်ပြုခြင်းနှင့်ဖတ်ပါအီလက်ထရွန်းနစ်ပုံစံသို့ပုံနှိပ်သို့မဟုတ်စာဖြင့်ရေးသားစာရွက်စာတမ်းများထံမှ (လည်း glyphs ကိုခေါ်) ထိုသို့သောနံပါတ်များ, အက္ခရာနှင့်ပုဒ်ဖြတ်ပုဒ်ရပ်အဖြစ်ဇာတ်ကောင်ပြောင်းလဲပေးတဲ့ဆော့ဗ်ဝဲနည်းပညာဖြစ်ပါတယ်။ တစ်ဦးစာရွက်စာတမ်း scan ဖတ်ခြင်းသို့မဟုတ်ဒစ်ဂျစ်တယ်ကင်မရာနှင့်အတူမှတ်တမ်းတင်ဓါတ်ပုံများရိုက်ကူးခြင်းနှင့်အခြားသူများကိုယခင်က OCR မပါဘဲ scan ဖတ်သို့မဟုတ်မှတ်တမ်းတင်ဓါတ်ပုံများရိုက်ကူးခဲ့ကြကြောင်းစာရွက်စာတမ်းများမှဤဖြစ်စဉ်ကိုလျှောက်ထားနိုင်ပါသည်ကြောင့်တချို့က OCR အစီအစဉ်များသည်ဤလုပ်ပါ။ OCR အသုံးပြုသူများအနေ PDF စာရွက်စာတမ်းများ, ပြင်ဆင်ရန်စာသား, နှင့် Re-format နဲ့စာရွက်စာတမ်းများအတွင်းရှာဖွေခွင့်ပြုထားသည်။

အဘယ်အရာကို OCR များအတွက်အသုံးပြုပါသလဲ?

အမြန်အဘို့, လိုအပ်ချက်များကိုဖြည့်စကင်ဖတ်ဖို့နေ့တိုင်း, OCR ကြီးမားတဲ့သဘောတူညီချက်မည်မဟုတ်ပါ။ သငျသညျစကင်ဖတ်စစ်ဆေးဖို့၏ကြီးမားသောငွေပမာဏကိုပြုလျှင်သင်လိုအပ်အတိအကျတဦးတည်းကိုရှာဖွေ PDF များအတွင်းရှာဖွေနိုင်ဖြစ်ခြင်းအချိန်အတော်လေးနည်းနည်းကယ်တင်နှင့်သင့်ကင်နာအစီအစဉ်တွင် OCR လုပ်ဆောင်နိုင်စွမ်းကို သာ. အရေးကြီးသောစေသည်နိုင်ပါတယ်။ ဤတွင် OCR နှင့်အတူကူညီပေးသည်အချို့နဲ့အခြားအရာဖြစ်ကြ၏:

အဘယ်ကြောင့်အသုံးပြုမှု OCR?

အဘယ်ကြောင့်ရုံပိုင်ခွင့်, ပုံယူမဟုတ်လော ဒါကြောင့်ကိုယ့်ပုံရိပ်တစ်ခုပါလိမ့်မယ်ဘာဖြစ်လို့လဲဆိုတော့သင်သည်တစုံတခုကိုတည်းဖြတ်သို့မဟုတ်စာသားရှာဖွေနိုင်ပါလိမ့်မည်မဟုတ်လို့ပဲ။ စာရွက်စာတမ်းစကင်ဖတ်ဖို့နှင့် OCR software ကို run နေသင်တည်းဖြတ်နှင့်ရှာဖွေနိုင်ပါလိမ့်နိုင်ပါတယ်တစ်ခုခုသို့ဖိုင်ကိုဖွင့်နိုင်ပါတယ်။

OCR ၏သမိုင်း

စာသားမအသိအမှတ်ပြုမှု၏အလွန်အစောဆုံးအသုံးပြုမှုကို 1914 ခုနှစျမှစတငျနေစဉ်, OCR-related နည်းပညာများ၏ကျယ်ပြန့်-ပျံ့နှံ့ဖွံ့ဖြိုးရေးနှင့်အသုံးပြုမှုအထူးသဒီဂျစ်တယ်-ဖတ်လို့ရအောင်စာသားကိုကူးပြောင်းရန် ပို. လွယ်ကူခဲ့အလွန်ရိုးရှင်းသောစာလုံးတွေ၏ဖန်ဆင်းခြင်းနှင့်အတူ 1950 ခုနှစ်တွင်စားရန်ဖြစ်တော်မူ၏အတွက်စတင်ခဲ့သည်။ ဤအရိုးရှင်းသောဖောင့်၏ပထမဦးဆုံးဒါဝိဒ်သည် Shepard အသုံးပြုနေသူများကဖန်တီးခြင်းနှင့်လေ့ OCR-7B အဖြစ်လူသိများခဲ့သည်။ OCR-7B အကြွေးကတ်များနှင့်ဒက်ဘစ်ကဒ်ပေါ်တွင်အသုံးပြုစံဖောင်များအတွက်ဘဏ္ဍာရေးစက်မှုလုပ်ငန်းအတွက်အသုံးပြုနေဆဲယနေ့ဖြစ်ပါတယ်။ 1960 ခုနှစ်တွင်အများအပြားနိုင်ငံများရှိစာတိုက်န်ဆောင်မှုစှာအမေရိကန်ပြည်ထောင်စု, ဂရိတ်ဗြိတိန်, ကနေဒါနှင့်ဂျာမနီအပါအဝင်မေးလ် sorting, အရှိန်မြှင့်ရန် OCR နည်းပညာကိုသုံးပြီးစတင်ခဲ့သည်။ OCR နေဆဲကမ္ဘာတဝှမ်းစာတိုက်န်ဆောင်မှုများအတွက်မေးလ် sort ဖို့အသုံးပြုအဓိကနည်းပညာဖြစ်ပါတယ်။ 2000 ခုနှစ်တွင် OCR နည်းပညာ၏ကန့်သတ်ခြင်းနှင့်စွမ်းရည်၏သော့ချက်အသိပညာဗဟုသုတဖြင့်ဖွံ့ဖြိုးတိုးတက်ဖို့အသုံးပြုခဲ့သည် CAPTCHA အစီအစဉ်များ bot တွေဟာနှင့် Spam တွေကိုရပ်တန့်ဖို့ကိုအသုံးပြုခဲ့သည်။

ဆယ်စုနှစ်ကျော်, OCR ကြောင့်ကဲ့သို့သောဆက်စပ်နည်းပညာနယ်ပယ်များတွင်တိုးတက်မှုပိုမိုတိကျမှန်ကန်နှင့်ပိုမိုခေတ်မီစိုက်ပျိုးထားပြီး အတုထောက်လှမ်းရေး , စက်သင်ယူမှု နှင့်ကွန်ပျူတာရူပါရုံကို။ ယနေ့ OCR software ကိုပိုမြန်ပြီးပိုတိကျစွာအရင်ကထက်စာရွက်စာတမ်းများအသွင်ပြောင်းဖို့ပုံစံအသိအမှတ်ပြုမှု, အင်္ဂါရပ်ထောက်လှမ်း, နှင့်စာသားသတ္တုတူးဖော်ရေးအသုံးပြုသည်။