Optik belgilarni aniqlash (OCR) nima?

Optik Belgilar Ovozi (OCR), kompyuterlarni qo'lda kiritish yoki matn kiritish kerak bo'lmasdan o'qiydigan bosma, terilgan yoki qo'lda yozilgan hujjatning raqamli versiyasini yaratadigan dasturga ishora qiladi. OCR, odatda, skaner qilingan hujjatlarda PDF formatida ishlatiladi, lekin ayni paytda rasm faylidagi kompyuterning o'qiladigan matnli versiyasini ham yaratishi mumkin.

OCR nima?

OCR matnni tanib olish deb ham ataladi, bu raqamlar, harflar va tinish belgilar (glyphlar deb ham ataladi) kabi belgilarni yozma yoki yozma hujjatlardan elektron shaklga o'zgartiradigan dasturiy texnologiyasi bo'lib, u kompyuterlar va boshqa dasturiy ta'minotlar tomonidan osonlik bilan tan olinadi va o'qiladi. Ba'zi OCR dasturlari hujjatni skanerdan o'tkazish yoki raqamli kamera bilan suratga olish kabi bajaradi va boshqalar bu jarayonni OCRsiz oldin skaner qilingan yoki suratga olingan hujjatlarga qo'llashlari mumkin. OCR foydalanuvchilarga PDF-fayllarni qidirish, matnni tahrirlash va hujjatlarni qayta formatlash imkonini beradi.

OCR nima uchun ishlatiladi?

Tez, har kungi ko'rishni talab qilish uchun, OCR katta ish bo'lmasligi mumkin. Ko'p sonli skanerlashni amalga oshiradigan bo'lsangiz, kerakli ma'lumotlarni topish uchun PDF-larda qidirib topishingiz biroz vaqtni tejaydi va brauzer dasturida OCR funksiyasini yanada muhimroq qiladi. OCR quyidagi hollarda yordam beradi:

Nima uchun OCR foydalanasiz?

Nima uchun rasmni olish kerak? Hech narsa tahrir qila olmaysiz yoki matnni qidirib topa olmaysiz, chunki u faqat rasm bo'lishi mumkin. Hujjatni skanerlash va OCR dasturini ishga tushirish ushbu faylni tahrirlashingiz va qo'ng'iroq qilishingiz mumkin bo'lgan narsaga aylantirishi mumkin.

OCR tarixi

Matnni aniqlashning eng qadimdan qo'llanishi 1914 yilgacha bo'lgan davrda OCR bilan bog'liq texnologiyalarning keng tarqalgan rivojlanishi va ulardan foydalanish 1950-yillarda, ayniqsa, soddalashtirilgan shriftlarni yaratish bilan boshlandi, ular raqamli o'qiydigan matnga aylantirish osonroq bo'ldi. Ushbu soddalashtirilgan fontlardan birinchisi David Shepard tomonidan yaratilgan va odatda OCR-7B sifatida tanilgan. OCR-7B hali ham bugungi kunda moliyaviy tizimda kredit kartalari va debet kartochkalarida qo'llaniladigan standart shrift uchun qo'llanilmoqda. 1960-yillarda bir nechta mamlakatlardagi pochta xizmatlari AQSh, Buyuk Britaniya, Kanada va Germaniyani o'z ichiga olgan pochta jo'natmalarini ko'paytirish uchun OCR texnologiyasidan foydalanishni boshladi. OCR butun dunyodagi pochta xizmatlarini pochta bilan tartiblash uchun ishlatiladigan asosiy texnologiya. 2000 yilda Botlarni va spam-botlarni to'xtatish uchun ishlatiladigan CAPTCHA dasturlarini ishlab chiqish uchun OCR texnologiyasining chegaralari va imkoniyatlarini bilish uchun foydalanildi.

O'nlab yillar mobaynida OCR sun'iy aql , kompyuterni o'rganish va kompyuterni ko'rish kabi sohalarda rivojlanish tufayli yanada aniqroq va murakkablashgan. Bugungi kunda, OCR dasturi avvaldan ko'ra tezroq va aniqroq hujjatlarni aylantirish uchun naqshni aniqlash, xususiyatni aniqlash va matnlarni qidirishni qo'llaydi.