Bei Erkennungsquoten jenseits von 99 % scheinen Verbesserungen nur noch kosmetische Bedeutung zu haben. Doch das ist ein Irrtum. Werden Tausende oder sogar Millionen Dokumente täglich gescannt und kommt es auf vollständige Erfassung der Daten an, achten die Betreiber von Datenerfassungslösungen vor allem darauf, wie viele Zeichen manuell korrigiert oder nacherfasst werden müssen. Und diese Zahl wird durch RecoStar 3.0 im Vergleich zur Vorgängerversion deutlich gesenkt.
RecoStar wird seit über zehn Jahren überall dort eingesetzt, wo es darum geht, große Belegvolumen zu verarbeiten: In Banken, bei Versicherungen, im Gesundheitswesen, bei Behörden oder bei Volkszählungen. Praktiker wissen die hohe Erkennungsleistung des Produkts zu schätzen. Sie wissen aber auch, dass nicht jede Verbesserung der optischen Zeichenerkennung in den Anwendungen wirksam wird. Um die Leistung einer Erfassungslösung zu steigern, haben Anwender viele Plausibilitätskontrollen und logische Ergänzungen programmiert. So reicht es zur Erkennung einer Ortsangabe manchmal, wenn die OCR lediglich einige Zeichen aus Postleitzahl und Ort liefert. Den Rest steuert eine Datenbank bei.
Um in solchen hoch optimierten Lösungen noch deutliche Verbesserungen zu erzielen hat Océ Document Technologies das hauseigene Voting erweitert. Nicht mehr nur die beiden Basiserkennungen der ehemaligen Computer Gesellschaft Konstanz und AEG Electrocom, sondern eine Vielzahl daraus abgeleiteter „Spezial-Engines“ arbeiten parallel. „Wir haben ein neues Multiple-Expert-Voting entwickelt, um aus den Einzelergebnissen das korrekte Gesamtergebnis zu synthetisieren. Beim Voting wird nun auch Kontextwissen über den zu erkennenden Text benutzt“, erläutert Entwicklungsleiter Dr. Wolfgang Lellmann und ergänzt: „Doch ohne einen Praxistest wären wir nicht sicher gewesen, dass die Verbesserungen auch bei den Korrekturkräften ankommen. Der mehrmonatige Praxistest hat uns diese Sicherheit gegeben.“
Die neue Version RecoStar Professional 3.0 ist ab sofort verfügbar. Neben der beschriebenen Performancesteigerung wurden etliche Einzelfunktionen erweitert, insbesondere in der Bildvorverarbeitung.