Rozwiązaniem tej kwestii jest właśnie OCR, czyli Optical Character Recognition. To oprogramowanie, które służy do przekształcania zeskanowanych obrazów tekstu (np. zdjęć, plików .bmp, .jpg) w edytowalny tekst komputerowy. W praktyce bardzo często spotykam się z OCR-em podczas digitalizacji dokumentów w biurze – wystarczy zeskanować papierową fakturę albo umowę i w kilka chwil system przetwarza ją na plik tekstowy, który można dalej edytować np. w Wordzie. To narzędzie kluczowe zarówno w archiwizacji dokumentów papierowych, jak i automatyzacji wprowadzania danych. Standardy branżowe, takie jak ISO 19005 (PDF/A), wręcz zalecają stosowanie OCR do przygotowania cyfrowych archiwaliów. OCR radzi sobie coraz lepiej z różnymi fontami, układami tekstu, nawet z lekkimi szumami i zagięciami papieru, choć wiadomo – nie zawsze jest idealnie, szczególnie przy ręcznym piśmie czy kiepskiej jakości skanach. Moim zdaniem OCR bardzo ułatwia życie i pozwala zaoszczędzić masę czasu, bo nie trzeba wszystkiego przepisywać ręcznie. Warto znać to narzędzie i umieć z niego korzystać, bo jest szeroko wykorzystywane zarówno w korporacjach, jak i w małych firmach czy szkołach.
Wiele osób myli narzędzia informatyczne, które z pozoru wydają się mieć coś wspólnego z przetwarzaniem plików czy obrazów. Przykładowo, ZIP to najpopularniejszy algorytm kompresji plików – używany do zmniejszania rozmiaru danych czy archiwizowania dokumentów, ale absolutnie nie ma nic wspólnego z rozpoznawaniem tekstu na obrazach. To raczej rozwiązanie do organizacji i transferu dużych ilości plików. Z kolei RIP, czyli Raster Image Processor, to komponent wykorzystywany zwłaszcza w branży poligraficznej. Jego zadaniem jest konwersja plików graficznych (zazwyczaj wektorowych) do formy rastrowej, którą mogą zrozumieć drukarki czy naświetlarki. RIP nie analizuje tekstu, tylko przetwarza obraz na punkty rastrowe niezbędne przy druku – więc nie nadaje się do digitalizacji treści tekstowych. CAD natomiast to zupełnie inna bajka. To oprogramowanie wykorzystywane do projektowania inżynierskiego, architektonicznego czy mechanicznego, pozwalające rysować i modelować różne obiekty, ale rozpoznawanie pisma w bitmapie jest mu zupełnie obce. Często widzę, że ludzie wybierają którąś z tych opcji, bo mają w głowie ogólne skojarzenia z grafiką czy plikami, ale w branży informatycznej bardzo ważna jest precyzja i świadomość, do czego konkretne narzędzia służą. OCR, czyli optyczne rozpoznawanie znaków, to standard w digitalizacji dokumentów i automatyzacji pracy z tekstem na obrazach – i tylko to narzędzie zapewnia funkcjonalność, o którą pyta to zagadnienie.