Rozszyfrować biznes

Rozszyfrować biznes Canon / NetSprint

W biurach na całym świecie pracownicy na co dzień stają przed bardzo podobnymi wyzwaniami i problemami.

Wśród nich są m.in. ograniczenia związane z przesyłaniemdużych plików graficznych czy PDF, kwestie związane z archiwizacją czy też przeszukiwaniemobszernych dokumentów. Tę listę zamyka odręczne przepisywanie tekstów, którejest chyba jedną z najbardziej uciążliwych biurowych czynności.

Szukając rozwiązań, warto czasem wziąć po uwagę to, czymfirma dysponuje i wykorzystać dostępne narzędzia do wprowadzenia usprawnień. W praktyczniekażdym biurze – nawet tym najmniejszym - jest urządzenie wielofunkcyjne, a wwiększości także skaner. Za sprawą oprogramowania można jeszcze lepiejwykorzystać potencjał jaki oferują. Od czego zacząć wprowadzenie usprawnień wcodziennej pracy? Dobrym pomysłem wydaje się być OCR.

OCR: do czego służy i jak działa

OCR (ang. Optical Character Recognition) to oprogramowanie do rozpoznawania znaków, dzięki któremu zeskanowane dokumenty, zapisane w pliku graficznym, są analizowane pod kątem tekstu i zapisywane w wybranym formacie tekstowym, który pozwala na dalszą edycję. To duże ułatwienie, ponieważ eliminuje konieczność ręcznego przepisywania dokumentów.

Sam proces rozpoznawania znaków można podzielić na kilka etapów. Zacząć należy od zeskanowania dokumentu, który zapisywany jest jako zdjęcie lub grafika. Po otwarciu takiego pliku przez program do rozpoznawania znaków następuje analiza jego zawartości i podział strony na sekcje zawierające tekst i inne elementy (grafiki czy zdjęcia). To jest pewnego rodzaju mapa dla programu, dzięki której w kolejnym etapie może precyzyjnie rozpoznać tekst.

Kolejna faza to już właściwe rozpoznawanie poszczególnych znaków i całych słów, które następnie łączone są w zdania i akapity. W zależności od oprogramowania, do tej szczegółowej analizy wykorzystywane są różne techniki. Wśród najpopularniejszych można wymienić rozpoznawanie wzorców (program porównuje zwartość z dostępną bazą) i rozpoznawanie cech (wyszukanie cech charakterystycznych dla danego znaku). Po zakończeniu analizy program – wykorzystując bazy słownikowe – składa tekst w całość, bazując na wcześniej utworzonej mapie dokumentu. Na koniec plik zapisywany jest w formacje tekstowym: PDF, DOC, TXT. Warto podkreślić, że plik zapisany jako PDF składa się w tym przypadku z dwóch warstw – zeskanowanego obrazu oraz tekstu, dzięki czemu z łatwością można go poddawać dalszej edycji.

Wartość dodana

Dostępna na rynku oferta oprogramowania OCR jest bardzo zróżnicowana, dlatego planując zakup rozwiązania warto przeanalizować potrzeby pracowników. Wiele typów oprogramowania (np. Readiris™ Pro 15) oferuje rozbudowaną funkcjonalność, dzięki której możliwe jest nie tylko optyczne rozpoznawanie znaków i całych tekstów w pliku graficznym o postaci rastrowej, ale także konwersja i kompresja dokumentów, czy możliwość przesyłania plików bezpośrednio do pamięci zlokalizowanych w chmurze. W efekcie użytkownik zyskuje dostęp do firmowych zasobów z dowolnego miejsca i o dowolnej porze. Taka niewielka zmiana, prowadzi do wielu usprawnień w przepływie i przetwarzaniu firmowych dokumentów.