OCR

Słownik kwalifikacji AUD.05 - Realizacja projektów graficznych i multimedialnych

Co to jest OCR?

OCR (ang. Optical Character Recognition) to technologia optycznego rozpoznawania znaków. Program OCR analizuje obraz dokumentu, np. skan lub zdjęcie strony, i zamienia widoczny na nim tekst na tekst edytowalny.

Oznacza to, że po użyciu OCR użytkownik może kopiować, poprawiać, wyszukiwać i formatować tekst w edytorze tekstu, zamiast przepisywać go ręcznie.

Do czego służy OCR?

OCR wykorzystuje się głównie do:
- zamiany zeskanowanych dokumentów na pliki tekstowe,
- rozpoznawania tekstu ze zdjęć,
- digitalizacji książek, formularzy i faktur,
- tworzenia przeszukiwalnych plików PDF,
- ułatwiania archiwizacji dokumentów.

Czego OCR nie robi?

Program OCR nie służy przede wszystkim do:
- zwiększania rozdzielczości skanu,
- usuwania szumów z obrazu,
- kompresowania pliku,
- poprawiania jakości zdjęcia jako głównej funkcji.

Takie operacje mogą być wykonywane przez inne narzędzia graficzne lub moduły przygotowania obrazu, ale podstawowym zadaniem OCR jest rozpoznanie znaków i utworzenie edytowalnego tekstu.

Przykład zastosowania

Jeżeli zeskanujesz papierowe pismo, otrzymasz zwykle plik graficzny lub PDF zawierający obraz tekstu. Po zastosowaniu OCR program rozpozna litery i utworzy dokument, w którym można zaznaczać i edytować tekst.

Najważniejsze na egzamin

Funkcja programu OCR to stworzenie edytowalnego pliku tekstowego na podstawie zeskanowanego obrazu dokumentu.