Co to jest OCR?
OCR (ang. Optical Character Recognition) to technologia optycznego rozpoznawania znaków. Program OCR analizuje obraz dokumentu, np. skan lub zdjęcie strony, i zamienia widoczny na nim tekst na tekst edytowalny.
Oznacza to, że po użyciu OCR użytkownik może kopiować, poprawiać, wyszukiwać i formatować tekst w edytorze tekstu, zamiast przepisywać go ręcznie.
Do czego służy OCR?
OCR wykorzystuje się głównie do:
- zamiany zeskanowanych dokumentów na pliki tekstowe,
- rozpoznawania tekstu ze zdjęć,
- digitalizacji książek, formularzy i faktur,
- tworzenia przeszukiwalnych plików PDF,
- ułatwiania archiwizacji dokumentów.
Czego OCR nie robi?
Program OCR nie służy przede wszystkim do:
- zwiększania rozdzielczości skanu,
- usuwania szumów z obrazu,
- kompresowania pliku,
- poprawiania jakości zdjęcia jako głównej funkcji.
Takie operacje mogą być wykonywane przez inne narzędzia graficzne lub moduły przygotowania obrazu, ale podstawowym zadaniem OCR jest rozpoznanie znaków i utworzenie edytowalnego tekstu.
Przykład zastosowania
Jeżeli zeskanujesz papierowe pismo, otrzymasz zwykle plik graficzny lub PDF zawierający obraz tekstu. Po zastosowaniu OCR program rozpozna litery i utworzy dokument, w którym można zaznaczać i edytować tekst.
Najważniejsze na egzamin
Funkcja programu OCR to stworzenie edytowalnego pliku tekstowego na podstawie zeskanowanego obrazu dokumentu.