Oprogramowanie OCR

Z reguły, jeśli chodzi o programy do rozpoznawania zeskanowanego tekstu (OCR, optyczne rozpoznawanie znaków), większość użytkowników pamięta jedyny produkt - ABBYY FineReader, który jest niewątpliwie liderem wśród takich programów w Rosji i jednym z liderów na świecie.

Niemniej jednak, FineReader nie jest jedynym rozwiązaniem tego rodzaju: istnieją darmowe programy do rozpoznawania tekstu, usługi online dla tych samych celów, a ponadto takie funkcje są obecne w niektórych znanych programach, które mogą być już zainstalowane na twoim komputerze . Spróbuję napisać o tym wszystkim w tym artykule. Wszystkie rozważane programy działają w systemach Windows 7, 8 i XP.

Kierownik rozpoznawania tekstu - ABBYY Finereader

O FineReader (wymawiane jako Fine Reader) usłyszał, prawdopodobnie większość z was. Ten program jest najlepszy lub jeden z najlepszych do rozpoznawania tekstu wysokiej jakości po rosyjsku. Program jest płatny, a cena licencji do użytku domowego jest nieco niższa niż 2000 rubli. Można również pobrać wersję próbną programu FineReader lub skorzystać z rozpoznawania tekstu w trybie online w programie ABBYY Fine Reader Online (kilka stron można rozpoznać za darmo, a następnie za opłatą). Wszystko to jest dostępne na oficjalnej stronie programisty. http://www.abbyy.ru.

Zainstalowanie wersji próbnej programu FineReader nie spowodowało żadnych problemów. Oprogramowanie można zintegrować z Microsoft Office i Windows Explorer, aby ułatwić uruchamianie rozpoznawania. Ograniczenia bezpłatnej wersji próbnej - 15 dni użytkowania i możliwość rozpoznania nie więcej niż 50 stron.

Zrzut ekranu do testowania programów rozpoznawania

Ponieważ nie mam skanera, użyłem migawki z aparatu niskiej jakości telefonu, w którym nieznacznie edytowałem kontrast, by sprawdzić. Jakość nie jest dobra, zobaczmy, kto sobie z tym poradzi.

Menu FineReader

FineReader może uzyskać graficzny obraz tekstu bezpośrednio ze skanera, z plików graficznych lub aparatu. W moim przypadku wystarczyło otworzyć plik obrazu. Byłem zadowolony z wyniku - tylko kilka błędów. Od razu powiem, że jest to najlepszy wynik ze wszystkich testowanych programów podczas pracy z tym przykładem - podobna jakość rozpoznawania dotyczyła tylko bezpłatnej usługi online Free Online OCR (ale w tym przeglądzie mówimy tylko o oprogramowaniu, a nie o rozpoznawaniu online).

Wynik rozpoznawania tekstu w programie FineReader

Szczerze mówiąc, w przypadku tekstów cyrylicą, FineReader prawdopodobnie nie ma konkurentów.Zaletami programu są nie tylko jakość rozpoznawania tekstu, ale także szeroka funkcjonalność, obsługa formatowania, kompetentny eksport do wielu formatów, w tym Word docx, pdf i inne funkcje. Tak więc, jeśli zadanie OCR jest czymś, co ciągle napotykasz, to nie żałuj stosunkowo niewielkiej kwoty i to się opłaci: zaoszczędzisz ogromną ilość czasu szybko uzyskując wysokiej jakości wynik w programie FineReader. Nawiasem mówiąc, nie reklamuję niczego - naprawdę uważam, że ci, którzy muszą rozpoznać kilkanaście stron, powinni pomyśleć o zakupie takiego oprogramowania.

CuneiForm to darmowy program do rozpoznawania tekstu.

Moim zdaniem drugim najpopularniejszym programem OCR w Rosji jest darmowy CuneiForm, który można pobrać z oficjalnej strony internetowej. http://cognitiveforms.ru/products/cuneiform/.

Instalacja programu jest również bardzo prosta, nie próbuje instalować żadnego oprogramowania stron trzecich (takiego jak dużo wolnego oprogramowania). Interfejs jest zwięzły i przejrzysty. W niektórych przypadkach najprostszy sposób korzystania z kreatora, który jest pierwszą z ikon w menu.

Z próbką, której użyłem w programie FineReader, program nie poradził sobie, a dokładniej, wydał coś źle czytelnego i fragmenty słów.Druga próba została wykonana za pomocą zrzutu ekranu tekstu z witryny tego samego programu, który jednak musiał zostać zwiększony (wymaga skanowania o rozdzielczości 200dpi i wyższej, nie odczytuje zrzutów ekranu o szerokości linii czcionek 1-2 piksele). Tutaj zrobiła to dobrze (część tekstu nie została rozpoznana, ponieważ wybrano tylko rosyjski).

Rozpoznawanie tekstu CuneiForm

Dlatego możemy założyć, że CuneiForm jest czymś, co powinieneś wypróbować, szczególnie jeśli masz zeskanowane wysokiej jakości strony i chcesz je rozpoznać za darmo.

Microsoft OneNote - program, który możesz już mieć

W pakiecie Microsoft Office, począwszy od wersji 2007, a kończąc na bieżącym, 2013, istnieje program do robienia notatek - OneNote. Ma również funkcje rozpoznawania tekstu. Aby z niego skorzystać, wystarczy wkleić zeskanowany lub dowolny inny tekst do notatki, kliknąć prawym przyciskiem myszy i użyć menu kontekstowego. Zauważyłem, że ustawieniem domyślnym dla rozpoznawania jest angielski.

Uznanie w Microsoft OneNote

Nie mogę powiedzieć, że tekst jest doskonale rozpoznany, ale, o ile wiem, jest on nawet lepszy niż w CuneiForm.Plus program, jak już wspomniano, jest z dużym prawdopodobieństwem, że jest już zainstalowany na twoim komputerze. Chociaż, oczywiście, jego użycie w przypadku konieczności pracy z dużą liczbą zeskanowanych dokumentów raczej nie będzie wygodne, raczej nadaje się do szybkiego rozpoznawania wizytówek.

OmniPage Ultimate, OmniPage 18 - musi być czymś bardzo fajnym

Nie wiem, jak dobre jest oprogramowanie do rozpoznawania tekstu OmniPage: nie ma wersji próbnej, nie chcę go gdzieś ściągać. Ale jeśli jego cena jest uzasadniona i będzie kosztować około 5000 rubli w wersji do indywidualnego użytku, a nie Ultimate, to powinno to być coś imponującego. Strona programu: http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

Cena oprogramowania OmniPage

Jeśli czytasz cechy i recenzje, w tym publikacje w języku rosyjskim, zauważają, że OmniPage naprawdę zapewnia wysoką jakość i dokładność rozpoznawania, w tym w języku rosyjskim stosunkowo łatwo jest rozmontować nie najwyższej jakości skany i zapewnia zestaw dodatkowych narzędzi. Wadą nie jest najwygodniejszy, zwłaszcza dla początkującego użytkownika, interfejs. W każdym razie, na rynku zachodnim, OmniPage jest bezpośrednim konkurentem FineReadera i w anglojęzycznych rankingach walczą dokładnie między sobą, dlatego uważam, że program powinien być godny.

To nie wszystkie programy tego typu, istnieją również różne opcje dla małych darmowych programów, ale podczas eksperymentowania z nimi znalazłem dwie charakterystyczne dla nich główne wady: brak wsparcia cyrylicą lub różne, niezbyt użyteczne oprogramowanie w zestawie instalacyjnym, dlatego postanowiłem o nich nie wspominać tutaj