Bei Erkennungsquoten jenseits von 99 Prozent scheinen Verbesserungen nur noch kosmetische Bedeutung zu haben. Doch das ist ein Irrtum. Werden Tausende oder sogar Millionen Dokumente täglich gescannt und kommt es auf vollständige Erfassung der Daten an, achten die Betreiber von Datenerfassungslösungen vor allem darauf, wie viele Zeichen manuell korrigiert oder nacherfasst werden müssen. Diese Quote wird durch RecoStar 3.0 im Vergleich zur Vorgängerversion deutlich gesenkt.
RecoStar wird seit über zehn Jahren überall dort eingesetzt, wo es darum geht, große Belegvolumen zu verarbeiten: in Banken, bei Versicherungen, im Gesundheitswesen, in Behörden oder bei Volkszählungen. Praktiker wissen die hohe Erkennungsleistung des Produkts zu schätzen. Sie wissen aber auch, dass nicht jede Verbesserung der optischen Zeichenerkennung in den Anwendungen wirksam wird. Um die Leistung einer Erfassungslösung zu steigern, haben Anwender viele Plausibilitätskontrollen und logische Ergänzungen programmiert. So reicht es zur Erkennung einer Ortsangabe manchmal, wenn die OCR lediglich einige Zeichen aus Postleitzahl und Ort liefert. Den Rest steuert eine Datenbank bei.
Um in solchen hoch optimierten Lösungen noch deutliche Verbesserungen zu erzielen, hat Océ Document Technologies das hauseigene Voting erweitert.
Nicht mehr nur die beiden Basiserkennungen der ehemaligen Computer Gesellschaft Konstanz und von AEG Electrocom, sondern eine Vielzahl daraus abgeleiteter „Special-Engines“ arbeiten parallel. „Wir haben ein neues Multiple-Expert-Voting entwickelt, um aus den Einzelergebnissen das korrekte Gesamtergebnis zu synthetisieren. Beim Voting wird nun auch Kontextwissen über den zu erkennenden Text benutzt“, erläutert Entwicklungsleiter Dr.
Wolfgang Lellmann. „Ein mehrmonatiger Praxistest hat uns diese Sicherheit gegeben, dass die Verbesserungen auch bei den Korrekturkräften ankommen.“
Die neue Version RecoStar Professional 3.0 ist ab sofort verfügbar. Neben der Steigerung der Erkennungsleistung wurden zahlreiche Einzelfunktionen erweitert, insbesondere in der Bildvorverarbeitung.
Über Océ Document Technologies GmbH
Océ Document Technologies GmbH ist ein weltweit führendes Unternehmen in der Zeichenerkennung, der Dokumenten-Erschließung und im Dokumenten-Management.
Das Portfolio erstreckt sich über den ganzen Lebenszyklus eines Dokuments:
Scannen, Zeichenerkennung, Dokumenten-Klassifikation und -analyse, Archivierung, Dokumenten-Management und Dokumenten-Outputmanagement.
Innerhalb der Océ-Gruppe ist Océ Document Technologies ein internationales Kompetenzzentrum für DMS. Océ Document Technologies mit Hauptsitz in Konstanz beschäftigt rund 200 Mitarbeiter. www.odt-oce.com