OCR

Słownik kwalifikacji AUD.05 - Realizacja projektów graficznych i multimedialnych

Co to jest OCR?

OCR (ang. Optical Character Recognition) to technologia optycznego rozpoznawania znaków. Program OCR analizuje obraz dokumentu, np. skan lub zdjęcie strony, i zamienia widoczny na nim tekst na tekst edytowalny.

Oznacza to, że po użyciu OCR użytkownik może kopiować, poprawiać, wyszukiwać i formatować tekst w edytorze tekstu, zamiast przepisywać go ręcznie.

Do czego służy OCR?

OCR wykorzystuje się głównie do:
- zamiany zeskanowanych dokumentów na pliki tekstowe,
- rozpoznawania tekstu ze zdjęć,
- digitalizacji książek, formularzy i faktur,
- tworzenia przeszukiwalnych plików PDF,
- ułatwiania archiwizacji dokumentów.

Czego OCR nie robi?

Program OCR nie służy przede wszystkim do:
- zwiększania rozdzielczości skanu,
- usuwania szumów z obrazu,
- kompresowania pliku,
- poprawiania jakości zdjęcia jako głównej funkcji.

Takie operacje mogą być wykonywane przez inne narzędzia graficzne lub moduły przygotowania obrazu, ale podstawowym zadaniem OCR jest rozpoznanie znaków i utworzenie edytowalnego tekstu.

Przykład zastosowania

Jeżeli zeskanujesz papierowe pismo, otrzymasz zwykle plik graficzny lub PDF zawierający obraz tekstu. Po zastosowaniu OCR program rozpozna litery i utworzy dokument, w którym można zaznaczać i edytować tekst.

Najważniejsze na egzamin

Funkcja programu OCR to stworzenie edytowalnego pliku tekstowego na podstawie zeskanowanego obrazu dokumentu.

Co to jest OCR?

Do czego służy OCR?

Czego OCR nie robi?

Przykład zastosowania

Najważniejsze na egzamin

Pytania egzaminacyjne związane z tym terminem (2)