OCR

Słownik kwalifikacji INF.10 - Obsługa oprogramowania i sprzętu informatycznego wspomagających użytkownika z niepełnosprawnością wzrokową

Co to jest OCR?

OCR (ang. Optical Character Recognition) to technologia optycznego rozpoznawania znaków. Służy do zamiany tekstu widocznego na obrazie, skanie lub zdjęciu na tekst edytowalny, który można kopiować, przeszukiwać, odczytywać syntezatorem mowy albo zapisać w dokumencie tekstowym.

Do czego służy OCR?

OCR stosuje się wtedy, gdy tekst jest zapisany jako obraz, np. w:
- zeskanowanej kartce papieru,
- zdjęciu dokumentu,
- pliku graficznym rastrowym, np. JPG, PNG, TIFF,
- nieprzeszukiwalnym pliku PDF utworzonym ze skanu.

Bez OCR komputer widzi taki dokument tylko jako obraz, a nie jako litery i wyrazy.

Znaczenie dla osób z niepełnosprawnością wzrokową

Dla użytkowników niewidomych i słabowidzących OCR jest bardzo ważnym narzędziem. Pozwala przekształcić skan książki, pisma urzędowego czy etykiety w tekst możliwy do odczytania przez czytnik ekranu lub syntezę mowy TTS. Dzięki temu dokument wcześniej niedostępny może stać się dostępny cyfrowo.

Przykłady programów i usług OCR

Do rozpoznawania tekstu można używać m.in.:
- ABBYY FineReader,
- Tesseract OCR,
- funkcji OCR w Microsoft OneNote,
- Google Drive / Dokumenty Google,
- aplikacji mobilnych do skanowania i rozpoznawania tekstu.

O czym trzeba pamiętać?

Skuteczność OCR zależy od jakości obrazu. Najlepsze wyniki daje wyraźny skan, prosty układ strony, dobry kontrast i brak przekrzywienia. OCR może popełniać błędy, dlatego ważne dokumenty należy po rozpoznaniu sprawdzić.

Co to jest OCR?

Do czego służy OCR?

Znaczenie dla osób z niepełnosprawnością wzrokową

Przykłady programów i usług OCR

O czym trzeba pamiętać?

Pytania egzaminacyjne związane z tym terminem (3)