Oprogramowanie OCR - czym jest i do czego służy?

Oprogramowanie OCRSłyszałeś może o programach typu OCR? Czy wiesz, jak te specjalistyczne softy ułatwiają pracę podczas konwersji i odczytu zdjęć tekstu? Jeśli nie - koniecznie zapoznaj się z poniższym artykułem! Dowiesz się z niego, jak OCR (Optical Character Recognition) przekształca obrazy zawierające tekst w edytowalne i przeszukiwalne dokumenty. Artykuł opisuje również najnowsze osiągnięcia w technologii OCR, które znacząco zwiększają precyzję i szybkość rozpoznawania tekstu.

Magiczny skrót OCR

W momencie, gdy właśnie czytasz te słowa, Twój mózg przy współpracy ze wzrokiem stopniowo składa z kształtu nadawanego przez grę światła i cienia znaczenie liter. Na zasadzie podobnej do oczu działa właśnie oprogramowanie OCR (z angielskiego - optical character recognition), które "przerabia" pismo na znaki zrozumiałe dla komputera. W dzisiejszym świecie pełnym nowoczesnych technologii występuje on już nawet w formie specjalnych programów do odczytywania ręcznego pisma instalowanych na komórce, choć jednym z jego pierwszych miejsc występowania były wielkie maszyny sortujące listy.

Zasada działania

W momencie, gdy do komputera wrzucamy zdjęcie (zazwyczaj w formacie JPG) nie potrafi on zdefiniować, co dokładnie się na nim znajduje. Działa on na podobnej zasadzie, jak roboty indeksujące, poruszające się w Internecie. Potrzebuje specjalnego atrybutu (w przypadku robotów będzie to np. "alt"), który w prosty sposób opisywałby to, co znajduje się na przechowywanym pliku. Zasada ta stosuje się zarówno do zdjęć pisma, jak i różnego rodzaju ilustracji - postrzegane przez niego elementy to jedynie pixele, które składają się na dany plik. Zadaniem programu OCR jest zmienienie zdjęcia tekstu w "tekst właściwy", który byłby zrozumiały dla komputera. Najprostszym porównaniem byłoby tu przekształcenie formatu graficznego JPG w plik DOC lub TXT.

Sztandarowy przykład i jego funkcje

Bez wątpienia do jednego z najbardziej znanych programów typu OCR zaliczyć możemy produkt firmy Abbyy - FineReader. Do jego podstawowych możliwości zaliczyć możemy na przykład (mowa tu o jego 12, najnowszej wersji):

  • opcja morfologicznego wyszukiwania tekstu;
  • możliwość rozpoznawania między innymi pieczątek, hiperłącza, kodów kreskowych, czy prostych formuł chemicznych;
  • umiejętność przetwarzania pliku w formacie PDF;
  • aż 189 języków, które są rozpoznawane przez program!;
  • możliwość pełnego zachowania kolorów tekstów w niezmienionej formie.

To tylko niektóre z wielu opcji tego niezwykle przydatnego oprogramowania.

Oprogramowanie OCR

Kto najbardziej może skorzystać na jego używaniu?

Do grupy najczęstszych użytkowników programu zaliczyć możemy przede wszystkim osoby, które mają dużą styczność z dokumentacją pisaną odręcznie. Będą to więc przede wszystkim pracownicy urzędów państwowych, archiwiści, księgowi, notariusze, czy też ludzie odpowiedzialni za dygitalizację dokumentów. Dzięki automatyzacji procesów, które posiadają już niemal wszystkie programy OCR, umożliwiają one znaczne przyspieszenie ich pracy. Oszczędzają także często występujących pomyłek (związanych choćby z niewłaściwym odczytaniem charakteru pisma), które w trakcie przetwarzania na przykład kluczowych dokumentów finansowych mogą okazać się fatalne w skutkach.

W tym miejscu warto również wspomnieć, że możliwości OCR bardzo często wykorzystywane są także jako wsparcie dla innych programów. Przykładem mogą tu być różnego rodzaju aplikacje dedykowane dla architektów, dla których OCR stwarza tak zwany "podkład" pod dalsze działania w późniejszych fazach projektowania.

Jak widać - aplikacje OCR mają dość szerokie zastosowanie, zarówno jako samodzielnie działający program, ale też jako oprogramowanie kompatybilne dla innego typu softu.

Autor: www.alstor.pl.

Komentarze