OCR būtība
OCR (angļu: Optical Character Recognition) nozīmē optisku simbolu atpazīšanu, skenējot tekstu, lai to vēlāk varētu apstrādāt ar teksta redaktoriem. Šādus skenerus var izmantot arī testu rezultātu apstrādei, nolasot, kurā vietā atbilžu lapā ievilkti krustiņi.
Pēc skenēšanas iegūtais attēls tiek pārvērsts tekstā ar speciālas programmas - OCR palīdzību. Skenējot katrs burts tiek salīdzināts ar burtiem datora atmiņā. Lai varētu uzlabot teksta nolasīšanas kvalitāti, tika izveidoti speciāli OCR-A un OCR-B šrifti.
Ir trīs optiskās teksta informācijas iekārtu pamatklases:
Intelektuālais skeneris (angļu: inteligent scanner), kuru sauc arī par dokumentu sastādīšanas procesoru (angļu: compound document processor ). Tas spēj vienā dokumentā atpazīt kā grafiskus laukumus tā arī tekstu;
Lappu skeneris (angļu: page scanner) var nolasīt tekstu jebkurā lapas vietā, bet grafiku ignorē. Šāds skeneris ir ērts dienesta dokumentu skenēšanai;
Formu nolasītājs (angļu: form reader) ir iekārta, kura domāta dokumentiem ar nestandarta
drukāta un ar roku rakstīta teksta izvietojumam lapā.
Izmantojot OCR programmas:
lai nodrošinātu kvalitāti, labāk skenējiet ar plaknes, nevis rokas skeneriem;
izmantojiet daudzalfabetu programmatūru, lai varētu atpazīt arī nacionālos burtus;
skenējot tekstu ar burtu lielumu 8 pt un vairāk pietiek ar izšķirtspēju
300 dpi, mazākiem burtiem (5 -8 pt) - 400 dpi.
Secinājums
Skeneru popularitāte mājas un biroja lietošanai pieaug. Pat vienkāršākā skenera laimīgais īpašnieks lepojas ar to, ka viņa fotogrāfijas tiek uzglabātas ne tikai parastajā papīra formā, bet to var arī ierakstīt kompaktdiskā, publicēt tīmekļa vietnē vai nosūtīt uz citu pasaules galu pa e-pastu. Un teksta atpazīšanas iespēja! Cik daudz vienkāršāk ir tulkot dokumentu elektroniskā veidā, ātri skenējot lapu, nekā teksta atkārtotu ievadīšanu. Ikviens, kas pārstāv dažādu mūsdienu attēlveidošanas tehnoloģiju pielietojumu, saprot, kā skeneris var paplašināt savas spējas.
…