ABBYY FineReader Express 8.4: rozpoznať text z akéhokoľvek zdroja za behu (distribúcia kód dokončenie)
Makradar Technológia / / December 19, 2019
Digitálneho obsahu a elektronické verzie dokumentov nás obklopujú zo všetkých strán. Papier v našom živote je vľavo takmer žiadny priestor. Noviny a časopisy sa presťahovali do online podobe knihy čítame čítačky e-atramentu či tabletu, obyčajné listy vymeniť e-mailov a sms. Občas ale musíme pohrať s prvými papiermi, aby im získať v elektronickej podobe. Tu sa dostávame k pomoci špeciálnych programov, ktoré využívajú technológiu OCR OCR textu (Optical Character Recognition). Najznámejší z nich je bezpochyby ABBYYFineReader. Môžete ju použiť pre prevod papierových dokumentov do editovateľných formátov a uložiť vo formáte PDF na text s možnosťou vyhľadávania. A dnes máme veľkú príležitosť dozvedieť sa viac o tom.
* * *
Pre Macs, ABBYY FineReader Express ponúka len, napriek tomu má potrebnú funkčnosť. Kľúčové vlastnosti ABBYY FineReader Express je presnosť rozpoznávania a zachovanie vzhľadu, podporu pre mnoho jazykov (171 jazyk do troch jazykov v jednom dokument), transformácia a vytváranie PDF (prevod do PDF do editovateľných formátov), editor pre manuálne označovanie oblastí (text, tabuľka, obrázok) a jednoduché, užívateľsky prívetivé rozhranie Program.
prvý pohľad
prevádzkové okno FineReader Express je celkom minimalistický, existujú iba najnutnejšie položky. Bočný panel obsahuje náčrtky pridaných stránok a na isntrumentov panel tlačidiel s rozbaľovacieho zoznamu vyberte súbor jazyka a výstupu. Stále je premena a tlačidlá zoom. V opačnom prípade zodpovedá rozhranie pre rýchle expresné verziu, ktorá stávka na automatické vykonávanie operácií s minimálnou konfigurácia a zapojenie užívateľov.
skúškam
Po spustení nám FineReader spĺňa kompaktný okno s možnosťou výberu scenára. Tu sme vyzvaní na výber zdroja pre digitalizáciu: skener, fax, alebo čítať zo súboru. Je tiež vhodné špecifikovať jazyk dokumentu (jazyky, ak je viac ako jeden) - pomôže zlepšiť presnosť rozpoznávania originálneho dokumentu. No, vlastne formát výstupného súboru, všetko je jednoduché - vybrať na základe typu papierového dokumentu.
Skener po ruke som nemal, ale je to ešte lepšie - používať ako zdroj fotografií vykonaný pomocou iPhone, som komplikovaná úloha rozpoznať text. Ako príklad textu, vzal som jedného z knihy jeho manželky, rovnako ako príklad tabuľky - niektoré staré pracovné filmovú zásielku iPhone. Tak začnime.
Každá stránka s textom
Pre nedostatok skenera len som knihu svojich fotografií - foto normálny prístup svetla do miestnosti, žiadny statív a ďalšie vylepšenia. Tu je originál:
Pozrime sa, čo to môže robiť s FineReader. Určíme, že chceme vytiahnuť fotografiu textu, nastaviť jazyk, ako v ruštine, a začať proces.
Na svojom konte, musí byť žiadosť uviedol, že celý text bol definovaný, vrátane náhodne dostal ohnúť susednej stránku. Kus tabuľky, ktoré som konkrétne vľavo v ráme, je definovaný ako očakávané obrázok. Ale nie je to tak hrozné, pretože môžeme ručne zmeniť doménu, určiť jeho typ (v prípade, že program nie je správne nastavený) a odstrániť polia, ktorých uznanie je požadované. Všetky manipulácia mi trvalo menej ako minútu, ale nakoniec som sa sem dostal, je celkom prijateľný výsledok:
Po krátkom korektúry a úpravy je dokument pripravený. Myslím, že to je dobrý výsledok pre rýchle a takmer procesu automatického rozpoznávania, ako je.
rozpoznať tabuľku
Ako experimentálne tabuľka podáva nenáročný zákona, ktorý bol tiež natočený na iPhone. K dispozícii je už používaný ukrajinsky (spolu s kontrolným jazykovou podporou), čo je tiež dobré pre naše skúsenosti. Voľba nového skriptu (⌘N) Uvedenie zdroja - čítanie zo súboru, jazyk - Ukrainian, a výstupný súbor - stolní.
Program si myslí, že po dobu niekoľkých sekúnd, a tu máme výsledok:
S programom tabuľka nie je zaobchádzať tak dobre, ale to je viac či menej prijateľné v zásade znení definície, ak príčinou až do konca bunky, ktoré neboli v pôvodnom dokumente. Tam bude musieť poupraviť trochu dlhšie dostať konečnú podobu mapy dokumentu, ale je to jednoduchšie ako písanie znamenie rúk od nuly.
Uložiť do PDF
Pri ukladaní do formátu PDF, program bohužiaľ nezlepšuje pôvodný obrázok (kontrast, jas) a je umiestnený v dokumente PDF, ako je. Ale menej, vyhľadávanie textu je prítomný, a to je dobre.
následok
Rovnako ako každý nástroj, FineReader má svoje klady a zápory. Silné, okrem uvedených vlastností výrobcu, je to, že OCR stoly a funguje pomerne dobre, a previesť do formátu PDF, ako som sľúbil, podporuje vyhľadávanie Text. Nevýhodou je nedostatok možností a veľmi skromné prostriedky na ručné riadenie procesu. Ale toto je čiastočne oprávnená, skutočnosť, že sa jedná o expresné verziu a funguje automaticky.
Kódy pre FineReader Express programu wonov Gregory Ushar a Nikolai Blinov. Blahoželáme! Pre kontrolu súkromných správ, kódy poslal.