Co to jest OCR?
OCR (ang. Optical Character Recognition) to technologia optycznego rozpoznawania znaków. Służy do zamiany tekstu widocznego na obrazie, skanie lub zdjęciu na tekst edytowalny, który można kopiować, przeszukiwać, odczytywać syntezatorem mowy albo zapisać w dokumencie tekstowym.
Do czego służy OCR?
OCR stosuje się wtedy, gdy tekst jest zapisany jako obraz, np. w:
- zeskanowanej kartce papieru,
- zdjęciu dokumentu,
- pliku graficznym rastrowym, np. JPG, PNG, TIFF,
- nieprzeszukiwalnym pliku PDF utworzonym ze skanu.
Bez OCR komputer widzi taki dokument tylko jako obraz, a nie jako litery i wyrazy.
Znaczenie dla osób z niepełnosprawnością wzrokową
Dla użytkowników niewidomych i słabowidzących OCR jest bardzo ważnym narzędziem. Pozwala przekształcić skan książki, pisma urzędowego czy etykiety w tekst możliwy do odczytania przez czytnik ekranu lub syntezę mowy TTS. Dzięki temu dokument wcześniej niedostępny może stać się dostępny cyfrowo.
Przykłady programów i usług OCR
Do rozpoznawania tekstu można używać m.in.:
- ABBYY FineReader,
- Tesseract OCR,
- funkcji OCR w Microsoft OneNote,
- Google Drive / Dokumenty Google,
- aplikacji mobilnych do skanowania i rozpoznawania tekstu.
O czym trzeba pamiętać?
Skuteczność OCR zależy od jakości obrazu. Najlepsze wyniki daje wyraźny skan, prosty układ strony, dobry kontrast i brak przekrzywienia. OCR może popełniać błędy, dlatego ważne dokumenty należy po rozpoznaniu sprawdzić.