Excel i skanowanie faktur

Jeśli posiadasz pakiet MS Office 365 (wersja subskrypcyjna) to pewnie wiesz, że co jakiś czas Microsoft dodaje do niego nowe funkcjonalności. Już wkrótce trafi do Excela ciekawa funkcja (obecnie jest dostępna dla testerów) jaką jest rozpoznawanie tekstu na obrazkach. W ten sposób możesz np. skanować faktury i importować je do Excela.

W ramach eksperymentu postanowiłem wydrukować taki oto arkusz z przykładowymi danymi:

W kolejnym kroku zeskanowałem wydrukowany dokument (300 DPI) i zapisałem go na dysku. Następnie na karcie Dane wybrałem polecenie Z obrazu -> Obraz z pliku.

Po prawej stronie wyskoczył Panel Dane z obrazu.

Na czerwono zostały zaznaczone fragmenty, co do których Excel nie ma pewności, czy tekst został poprawnie rozpoznany (w moim przypadku są to 2 komórki w tytułowym wierszu Tabeli oraz 3 imiona). O dziwo we wszystkich „wątpliwych fragmentach” tekst został poprawnie rozpoznany. Widząc komórkę z czerwonym tłem mogę w nią kliknąć w celu dokonania korekty błędnie rozpoznanego tekstu.

Po dokonaniu wszystkich poprawek mogę kliknąc w przycisk Wstaw dane. Tak wygląda wstawiona tabelka do Excela:

Jak widzisz tekst został z grubsza poprawnie rozpoznany. Jedynie tam gdzie była taka sytuacja, że w jednej kolumnie była liczba (którą zwyczajowo Excel wyrównuje do prawej krawędzi komórki) a w kolumnie obok tekst (który Excel wyrównuje do lewej krawędzi komórki) liczba z tekstem została rozpoznana jakby była w jednej komórce. Zwróć uwagę, że kolumna A w której jest L.P. jest pusta a kolumna B w której znajdowały się imiona zawiera liczbę porządkową, spację i imię.

Podobna sytuacja jest w 16 wierszu (patrz kolumnu E i F).

Inna usterka, którą wyłapałem wystepuje w komórce D1 gdzie tekst został nieco błędnie rozpoznany (mamy dużą literę I zamiast cyfry 1).

Nastomiast jestem pozytywnie zaskoczony, gdyż z wszytskie imiona i nazwiska zostały poprawnie rozpoznane oraz wszystkie liczby w tabelce są poprawne.

Postanowiłem dać drugą szansę. W oryginalnej tabelce dodałem krawędzie, następnie znów wydrukowałem i zeskanowałem dane do pliku. Efekt nieco lepszy, ale nadal są pewne usterki.

Teraz kolumna A nadal jest pusta, ale liczby wylądowały w nowej kolumnie i nie są połączone z imionami. Z kolei w 16 wierszu nie mamy tej usterki, że liczba została połączona z tekstem z nastepnej komórki.

Postanowiłem na koniec wykonać prosty eksperyment: oryginalny zeskanowany plik obróciłem o 90 stopni (wszak czasami zdarza się, że tabele zawierające wiele kolumn drukuje się w układzie poziomym). Tutaj niestety, ale Excel totalnie się nie popisał:

Ogólnie to narzędzie całkiem dobrze sobie radzi z rozpoznawaniem tekstu w wydrukowanych tabelkach (o ile dane w pliku graficznym nie są obrócone o 90 stopni). Natomiast jeśli chodzi o skanowanie książek to niestety, ale Excel nie zastąpi porządnego programu OCR.

Jeśli posiadasz potrzebę skanowania książek zapoznaj się z artykułem: Jak zamienić zeskanowany dokument na tekst

Ten wpis został opublikowany w kategorii excel - samouczki i oznaczony tagami , , . Dodaj zakładkę do bezpośredniego odnośnika.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.