Geballte Kraft für bessere Datenerkennung: Mit dem CLARC SOLUTION BUILDER ADDON hat die CTO Balzuweit GmbH aus Stuttgart ihre Datenextraktionslösung CLARC XTRACT um zahlreiche Funktionen erweitert. Bis zu vier OCR Engines lesen parallel Daten aus gescannten Dokumenten aus und kombinieren ihre jeweiligen Stärken für ein optimales Extraktionsergebnis.
Eine der neuen Funktionen ist die Hybriderkennung von gemischten PDF-Dokumenten. War es bisher nur möglich, die Dokumente entweder als umgewandelte Bilddatei auszulesen und eventuelle Einbußen bei der Texterkennung hinzunehmen oder aber bei der der Erkennung als Textdokument auf Bildinhalte zu verzichten, werden nun beide Erkennungskriterien kombiniert. Damit wird ermöglicht, in Dokumenten z.B. sowohl das Unternehmenslogo als auch die Textdaten optimal zu erkennen.
Ein weiteres Novum ist die Objekt-Datentyp-Erkennung mit Klassifizierung und Zugriff auf den typisierten Inhalt. Hierbei werden die in dem Dokument enthaltenen Daten erkannt, typisiert und normalisiert. Die Lösung ist somit in der Lage, Informationen, wie z.B. Belegnummern, Belegarten, Bankverbindungen oder Steuerinformationen, automatisiert zu erkennen und weiterzuverarbeiten.
Zudem zeichnet sich die Lösung durch eine trainierbare Tabellenerkennung aus. Tabellenkopf und –spalten sind komfortabel über einen Assistenten zum Erkennen der Tabellenwerte zuweisbar. Die Tabellenwerte können durch Anleitung des Anwenders problemlos von der Lösung erlernt werden. So lassen sich selbst komplizierte Tabellenstrukturen einfach im System definieren.