Unternehmensprozesse optimieren mit OCR Software

Trends im IT-Check

Veröffentlicht 11.09.2018
5 min Lesezeit
Teilen

Unternehmensprozesse optimieren mit OCR Software

Sie lesen diese Worte und mit Hilfe Ihrer Augen sowie Ihres Gehirns können Sie sie verarbeiten und verstehen. Sie erkennen nicht nur ganze Wörter und Sätze, sondern auch Buchstaben, Zahlen und die Zeichensetzung. All dies lässt sich im Grunde als optische Zeichenerkennung zusammenfassen. Gibt es für Computer eine Möglichkeit, genau das bei Papierunterlagen, handschriftlichen Texten oder "nicht lesbaren" Dokumenten zu tun? Ja, die sogenannte OCR-Technologie ist dazu fähig.

In diesem Artikel wird erklärt, wie die OCR-Software funktioniert, wofür die optische Zeichenerkennung am häufigsten verwendet wird und wie Ihr Unternehmen von der Einführung solcher OCR-Systeme in Hinsicht auf die Belegverarbeitung und das Content Management profitieren kann.

Was ist OCR und wie funktioniert sie?

Bei der Software für optische Zeichenerkennung (OCR – Optical Character Recognition) handelt es sich um ein maschinelles oder elektronisches Verfahren zur Umwandlung von handschriftlichen, maschinengeschriebenen, eingescannten, fotografierten, gefaxten, gedruckten (sowohl papiergebundenen als auch digitalen) Textdateien in maschinell verschlüsselte, bearbeitbare und durchsuchbare Dokumente von fast jedem beliebigen Format.

Einfach ausgedrückt: Ein Computer erkennt Bilder, aber nicht den Text an sich. Eine gedruckte Seite verkörpert für ihn lediglich eine Reihe bedeutungsloser Pixel, so dass er nicht zwischen einem Panoramabild von New York City, der Kritzelei Ihres Kindes, einem Scan der "Mona Lisa" oder der Rechnung für einen neuen Laptop unterscheiden kann. Er kann den Inhalt also nicht "lesen". Hauptaufgabe der OCR-Software ist es, den Text zu erfassen. Sie soll eine JPG-Datei schnell und exakt in ein DOC-Format umwandeln.

Die zugrundeliegende Idee von der Kommunikation und dem Informationsaustausch zwischen Mensch und Maschine ist nicht neu. Der Beginn der OCR-Technologie lässt sich bis in das 19. Jahrhundert zurückverfolgen, als die ersten Geräte zur Unterstützung von Blinden entworfen wurden. Im Jahr 1912 wurde Emanuel Goldberg ein Patent für eine Maschine bewilligt, die Zeichen lesen und in einen Telegrafiecode umwandeln konnte. Später wurden dann telegrafische Mitteilungen über Kabel und ohne menschliches Eingreifen übermittelt. Das erste OCR-ähnliche System wurde im Jahr 1929 von Gustav Tauschek erfunden. Seine Maschine verarbeitete Texte über Schablonen vor einem Fotodetektor. Sie konnte Zeichen erkennen, indem sie diese mit dem Zeichensatz auf der Schablone abglich. Leider machte bereits die kleinste Abweichung vom Muster es unmöglich, den Text zu erkennen. Die OCR-Software hat sich seitdem stark weiterentwickelt – moderne OCR-Leser sind mit Tausenden von Zeichensätzen und Hunderten von Wörterbüchern ausgestattet, um das am besten passende Wort anzugeben.

Heutzutage wird die OCR-Technologie meistens in Unternehmen verwendet, um Schriftstücke zu bearbeiten und Geschäftsinhalte so aufzubereiten, dass effiziente Arbeitsabläufe für den Dokumentenaustausch gestaltet werden können. OCR-Software gibt es in verschiedenen Ausführungen: von Scannern in privaten Smartphones, Desktop-Anwendungen, modernen Geschäftsplattformen bis hin zu serverbasierten Lösungen, die Millionen von Dateien ohne menschliches Eingreifen umwandeln können. Wenn Ihr Unternehmen also über eine ECM- oder EDI-Software verfügt, sollten Sie in Erwägung ziehen, diese um ein OCR-Lesegerät zu ergänzen.

Wie "liest" eine OCR-Software?

Es gibt unterschiedliche Methoden der Textverarbeitung mittels einer OCR-Software: Mustererkennung (Erkennen von Zeichen in ihrer Gesamtheit), Merkmalserkennung (Erkennen einzelner Elemente von jedem Zeichen – Linien, Striche, Winkel etc.), intelligente Zeichenerkennung (für handschriftliche Texte), optische Markierungserkennung (Erkennen von Antworten in Tests und Umfragen, in denen Befragte leere Felder mit Stift ausfüllen müssen) und optische Barcodeerkennung (Erkennen des Produkts und dessen Merkmale durch Einscannen eines Barcodes). Durch die Kombination der zuvor genannten Verfahren lassen sich Texte in allen gegebenen Dokumenten lesen: Bestellungen, Rechnungen, Briefe, Verträge, Formulare, Berichte, persönliche Fragebögen, Inhaltsverzeichnisse und viele mehr. Da sich dieser Artikel mit der Texterkennung beschäftigt, soll der Fokus auf den ersten drei Methoden liegen.

Mustererkennung

Wie bereits zuvor erwähnt, erkennt der Computer bei diesem Verfahren das komplette Zeichen und gleicht es mit den in der OCR-Software gespeicherten Zeichen ab. In den 1960ern wurde erstmals die spezielle nichtproportionale Schriftart OCR-A entwickelt, die für das Ausfüllen offizieller Bankschecks verwendet wurde. Jeder Brief ließ sich dadurch einfach von anderen unterscheiden. Sämtliche Drucker und Scanner wurden nur mit dieser Schriftart betrieben. Aufgrund dieser einen standardisierten Schrift erwies sich das OCR-System als unproblematisch. Später kamen gebräuchlichere Schriftarten hinzu. Allerdings gibt es so viele verschiedene Schriftarten, dass die Mustererkennung allein nicht ausreicht, um alle Zeichen richtig zu bestimmen (zumal es auch noch Handschriften gibt).

Merkmalserkennung

Da wo die Mustererkennung versagt, bietet sich die Merkmalserkennung an, um die Lücken zu füllen. Anstatt Buchstaben als Ganzes zu erkennen, ermittelt dieser OCR-Leser die einzelnen Komponenten: horizontale, vertikale und diagonale Linien; Winkel; Punkte, an denen sich Linien treffen; geschlossene Kreise; Schnittpunkte; diakritische Zeichen. Somit benötigen Sie keine Datenbank mit Schriftarten. Denn ganz unabhängig von der jeweiligen Form gelten immer die Regeln für das Schreiben eines Buchstabens oder einer Zahl. Die modernste OCR-Software, die Druckzeichen in jeder beliebigen Schriftart erkennt, basiert auf der Merkmalserkennung.

Intelligente Zeichenerkennung

Mit dieser Methode werden handschriftliche Texte sowie Kursivbuchstaben entziffert und zugleich kommt eine Engine für maschinelles Lernen zum Einsatz. Für Menschen ist es einfach, Handgeschriebenes zu lesen (auch wenn sicher jeder von uns einen Freund hat, dessen Schrift wir Hieroglyphen aussieht) – wir verstehen die Sprache, den Kontext und die Absicht des Verfassers. Für Computer hingegen ist so eine Entschlüsselung wirklich schwierig, doch mittels Hilfe nicht unmöglich. In OCR-freundlichen Formularen sind oft leere Kästchen vorgesehen, die in Großbuchstaben und mit dunkler Tinte auszufüllen sind. Auf diese Weise muss der Computer nur eine relativ kleine Menge an Informationen identifizieren.

reCAPTCHA

Falls Sie es noch nicht wussten: Sie haben wahrscheinlich dazu beigetragen, die OCR-Technologie weiterzuentwickeln. Genau dafür werden CAPTCHA-Rätsel eingesetzt. Sie sollen einerseits verhindern, dass Bots und Spammer missbräuchlich in E-Mail-Systemen, Internetforen, Onlinediensten, Ticketportalen usw. verwendet werden. Andererseits dienen die Tests jedoch auch einem zweiten Zweck: Millionen Menschen helfen Computern dabei, Wörter zu erkennen, die für sie schwer zu lesen sind. Dabei kann es sich um einen eingescannten Text aus einem alten Buch handeln, das digitalisiert werden soll und dessen Text kaum zu erkennen ist. Kurzum: Sie leisten hierbei große Hilfe!

Wofür ist OCR nützlich?

Die OCR-Technologie wird in vielen unterschiedlichen Industrien breit eingesetzt. Abgesehen von den Vorteilen für Ihr Unternehmen kann sie sehbehinderten Menschen das Lesen erleichtern und Historiker beim Bewahren kultureller Texte unterstützen. Im Folgenden werden einige Beispiele für den vorteilhaften Einsatz der optischen Zeichenerkennung vorgestellt:

Unterstützung blinder und sehbehinderter Menschen

In den 1970ern gründete Ray Kurzweil das Unternehmen Kurzweil Computer Products Inc., von dem das weltweit erste schriftartenunabhängige OCR-System geliefert wurde. Diese OCR-Computersoftware konnte die gängigsten Druckschriften erkennen und Texte (Bücher, Zeitschriften) laut für Blinde vorlesen. Der Text wurde also nicht nur entziffert, sondern auch an Sprachgeneratoren übermittelt (die wohl bekannteste computergestützte Stimme war natürlich die von Stephen Hawking). Die Maschine wurde auf einer Sonderkonferenz präsentiert, die von dem US-Blindenverband NFB (National Federation of the Blind) organisiert wurde.

Sortieren von Briefen in Postämtern

Der US-Postdienst USPS (United States Postal Service) verarbeitet und liefert 493,4 Millionen Postsendungen pro Tag. Das macht durchschnittlich 20,6 Millionen pro Stunde, 342.638 pro Minute und 5.711 verarbeitete Postsendungen jede Sekunde. Und wer ist für das Sortieren der gesamten Korrespondenz zuständig? Glücklicherweise haben die Mitarbeiter bei der Post kleine Helfer: OCR-Leser. Diese entschlüsseln nicht nur die computergenerierten Aufkleber, sondern auch handschriftliche Adressen und Postleitzahlen. Würden all diese Postsendungen manuell abgewickelt werden, käme es zu großen Verzögerungen bei der Auslieferung.

Sortieren von Dokumenten in Kanzleien und Gerichten

Die komplexesten Rechtsfälle und Ermittlungen führen zu endlosen Dokumentationen. Juristen müssen sich akribisch durch jede Seite kämpfen, um sicherzugehen, dass sie kein wichtiges Detail übersehen. OCR-Software hilft ihnen dabei, alle benötigten Akten zu digitalisieren und nach Stichwörtern, Daten, Namen etc. zu recherchieren. Somit müssen sie kein zusätzliches Personal einstellen, um diese Arbeit manuell durchzuführen, und vermeiden das Risiko, dass Informationen aufgrund von Überarbeitung oder menschlichen Fehlern übersehen werden.

Bewahren von historischen und kulturellen Texten

Bibliotheken, historische Organisationen oder Nichtregierungsorganisationen (wie das Projekt Gutenberg) archivieren Bücher, Manuskripte, Dokumente, Memoiren o. Ä. und bringen sie von Papierform in digitale Dateiform. Das manuelle Abtippen einer solchen Menge an Text wäre unmöglich. Dank eines OCR-Systems ist diese Aufgabe nicht nur machbar, sondern das Verfahren für die Bewahrung von Weltkulturgütern wird auch enorm vereinfacht.

Persönliche Identifikation

Rechtsdokumente wie Reise-/Pässe, Führerscheine, Fahrzeugscheine, Versicherungspapiere etc. lassen sich mit einer OCR-Software schnell bei Ämtern, der Polizei, Flughäfen und anderen Institutionen, die persönliche Daten verarbeiten, einscannen. Menschliche Fehler sind nie ausgeschlossen, doch die OCR-Technologie hilft dabei, Daten exakt abzurufen.

Verarbeiten von Rechnungen, Bestellungen und anderen Dokumenten

Viele Organisationen wandeln Papierrechnungen und schriftliche Verträge in digitale Texte um, damit die Daten für Finanzberichte, Zahlungen und den Dokumentenaustausch verwendet werden können. Es gibt diverse Dokumentenquellen und -formate: herkömmliche handschriftliche Papiere, PDF, JPG usw. Die Eingabe all dieser Daten in die Systeme eines Unternehmens gestaltet sich schwierig, nimmt sehr viel Zeit in Anspruch und führt letztlich zu einem nie endenden Stapel an Papierarbeit sowie viel zu vielen Fehlern. Eine OCR-Software ist daher ein wahrer Segen für Unternehmen. Untersuchungen haben gezeigt, dass Firmen, die OCR für die automatisierte Dateneingabe aus Rechnungen einsetzen, 25-60 % mehr Rechnungen verarbeiten als solche, die eine manuelle Dateneingabe anwenden. Hinzu kommt, dass OCR-Technologie die automatische Erfassung von Rechnungen ermöglicht, die auf dem traditionellen Postweg, per E-Mail, Fax oder über eine EDI-Plattform direkt im elektronischen Archiv eines Unternehmens eingehen.

Vorteile von OCR für Ihr Unternehmen

In einer von PayStream Advisors durchgeführten Umfrage wurden Befragte darum gebeten, den "Schmerz", den sie mit bestimmten Rechnungsverarbeitungsprozessen assoziieren, einzustufen. Auf einer Skala von 1 bis 5 (wobei 5 für eine große Unannehmlichkeit steht) erzielte die manuelle Dateneingabe die höchste durchschnittliche Schmerzbewertung mit 3,27 von 5; dicht gefolgt von dem Prozess der Fehlerlösung mit einer Einstufung von 3,17. Dies zeigt deutlich, dass das monotone Abtippen und die damit verbundene Fehleranfälligkeit bei Mitarbeitern, die für die Abwicklung von Dokumenten zuständig sind, sehr negativ bewertet wird. Eine OCR-Software trägt dazu bei, dass diese Fehlerrate verringert wird, und sie bietet Ihrem Unternehmen zahlreiche weitere Vorteile. Nachfolgend werden einige dieser positiven Effekte aufgelistet:

Zeiteinsparung

Die automatische Digitalisierung von Daten erfolgt viel schneller als deren manuelle Verarbeitung. Dateien lassen sich innerhalb von Minuten anstatt von Stunden archivieren und das Abrufen von relevanten Informationen oder archivierten Dokumenten geschieht in einem kurzen Augenblick.

Besseres Arbeitsmanagement

Wenn Sie Ihre Mitarbeiter mit den nötigen Tools ausstatten, werden Sie bald eine optimierte Arbeitseffizienz feststellen. Diese müssen ihre Zeit dann nicht mehr mit monotonen, langweiligen Tätigkeiten verbringen, sondern können sich stärker auf bisher zu kurz gekommene Aufgaben konzentrieren und produktivere Arbeit leisten.

Kostensenkung

Unternehmen geben 20 Dollar für die erforderliche Arbeitszeit zum Abheften eines Dokuments aus, 120 Dollar für die Arbeitszeit, die für die Suche nach einem falsch abgelegten Dokument benötigt wird, und 220 Dollar für die erforderliche Arbeitszeit zur Wiederherstellung eines nicht auffindbaren Dokuments.[5] Dies lässt sich ändern: Durch den Einsatz eines OCR-Systems können Sie die manuelle Arbeit und menschliche Fehler verringern und Geld sparen. Die Investition in eine OCR-Software wird sich also am Ende für Sie auszahlen.

Schnelle Recherche

Die Suche nach einer bestimmten Information gestaltet sich viel schneller, wenn Sie eine digitale, durchsuchbare Datei haben, als wenn Sie eine endlose Menge an Dokumenten Seite für Seite durchgehen müssen. Ihr Personal wird Ihnen für die verbesserte Arbeitsumgebung und die geringere Menge an Papierdokumenten dankbar sein.

Optimierte Geschäftsprozesse

Die manuelle Datenverarbeitung ist zeitraubend und liefert Ihrem Unternehmen keinen direkten Mehrwert. Sie kann Datenfehler, Verzögerungen, Missverständnisse, falsche Bestellungen, Lagerbestandsprobleme und einen langsamen Ablauf der Geschäftsprozesse verursachen.

Sichere Dokumente

Rechnungen, Verträge, personenbezogene Daten von Kunden und andere wichtige Informationen müssen rund um die Uhr komplett abgesichert sein. Jegliche Sicherheitsverstöße können Ihren Ruf schädigen und dazu führen, dass Sie Kunden verlieren. Die optische Zeichenerkennung ist meist Teil einer umfassenderen Lösung, mittels derer auch Ihre wichtigsten Daten sicher archiviert werden.

Keine Speicherprobleme mehr

Massive Aktenschränke, die in jedem Büro mit Tonnen von Akten bestückt sind, nehmen viel Platz weg. Die Menge an Dokumenten, die im Umlauf sind, scheint stetig zu wachsen und Sie werden bald keinen Platz mehr haben, um noch mehr Papierdokumentation abzulegen. In einem digitalen Archiv hingegen lassen sich die mit OCR verarbeiteten Dokumente einfach speichern und entsprechende Dateien schneller finden.

Verbesserte Kundenbetreuung

Lässt man Kunden warten, ist dies nicht besonders geschäftsförderlich. Mit Hilfe von OCR lassen sich Kundeninformationen innerhalb von Sekunden erfassen und bei Bedarf rasch abrufen. Insbesondere wenn ein aufgeregter Kunde Ihren Kundenberater anruft, muss dieser umgehend auf dessen Dokumente zugreifen können. Indem Sie Ihren Kundendienst vereinfachen und beschleunigen, optimieren Sie zugleich die gesamte Kundenerfahrung.

Umweltfreundlich

Bei der herkömmlichen Dokumentenverarbeitung werden nicht nur Tonnen an Papier verbraucht, es werden auch Verpackungsfolien, Klebeband, Kraftstoff für den Versand von Dokumenten, Tinte und andere Materialien verwendet. Umweltfreundlichkeit wird jedoch von vielen Kunden geschätzt, so dass der Einsatz von OCR auch hier einen Mehrwert für Ihr Unternehmen bietet.

Comarch Enterprise Content Management (ECM) plus OCR

Die optische Zeichenerkennung ist Bestandteil des Comarch Document Management. Dieses basiert auf dem System Enterprise Content Management (ECM), das einen synergetischen Ansatz für Dokumente, Daten und Prozesse ermöglicht. Dank der Software kann das Unternehmen Dokumente unabhängig von deren Format erfassen und sicher archivieren. Zudem bietet sie einen schnellen Zugriff auf Dokumenteninhalte, so dass aus Geschäftsprozessen resultierende Aufgaben rasch ausgeführt werden können.

Ein in Comarch ECM richtig implementiertes OCR-System liefert folgende Vorteile:

Effizientes "Lesen" der Daten aus Dokumenten unterschiedlichen Formats, einschließlich gescannter Dokumente, Faxe, E-Mails und deren Anhänge, Office-Dokumente, Fotos etc.
Intelligente Datenerkennung und Auto-Konfiguration des OCR-Moduls basierend auf geprüften Informationen, die vom Korrektor bereitgestellt werden (ohne vorkonfigurierte Vorlagen)
Umfassende Suche nach Stichwörtern in Dokumenten jedes beliebigen Formats
Automatische Erkennung von Dokumenten und deren getrennte Verarbeitung
Automatische Prozesse für spezifische Dokumentenarten (z. B. Archivierung, Weiterleitung)

Zusammenfassung

Mittels einer OCR-Software können die Kosten für menschliche Arbeit minimiert, Prozesse in Unternehmen und öffentlichen Einrichtungen automatisiert und der Zugriff auf wichtige Daten aus unterschiedlichen Quellen (Grafikdokumente, PDFs, Papierdokumente, E-Mails, Faxe etc.) beschleunigt werden. Aufgrund der Integration mit verschiedenen externen Systemen (z. B. EDI-Plattformen) oder internen Kundensystemen (ERP) dient Comarch ECM zudem als zentrale Anlaufstelle für alle Geschäftsinformationen des Unternehmens.

Des Weiteren kann sich die optische Zeichenerkennung im Alltag sehbehinderter Menschen als sehr hilfreich erweisen und sie ist ein nützliches Instrument für die Bewahrung kultureller und historischer Güter. Während die OCR-Technologie derzeit noch weiter perfektioniert wird, lässt sich für die Zukunft bereits voraussagen, dass sie breiten Einsatz und großen Anklang finden wird.

Unternehmensprozesse optimieren mit OCR Software

Comments

Ähnliche Artikel zu folgenden Themen