Während es zahlreiche Techniken gibt, durchgängige Striche als Text zu lesen, versagen sie alle, wenn es sich um Punktmatrizen handelt, wie sie industrielle Matrixdrucker erzeugen. Jedes Bild muss dann zuerst vorverarbeitet werden, um die einzelnen Punkte zu separaten durchgängigen Strichen zu verschmelzen, bevor die klassische OCR sie lesen kann. Hier die richtige Vorverarbeitung zu finden ist zeitaufwändig, oft von Versuch-und-Irrtum abhängig, und benötigt umfangreiches Wissen, Können und Erfahrung. Dazu kommt, dass die Vorverarbeitung zum Erzielen der Verbesserung nicht immer möglich ist oder stark von den jeweiligen Gegebenheiten abhängt und somit nicht universell verwendbar ist. Aber selbst Vorverarbeitung hilft bei der herkömmlichen OCR nicht weiter, wenn der Abstand zwischen den Punkten eines Zeichens grösser ist als der Abstand zwischen den Zeichen selbst. Die Situation wird noch schwieriger, wenn die in der Praxis häufigen Verformungen berücksichtigt werden. Zeichen können komprimiert, gedehnt, und in verschiedene Richtungen und unterschiedlichen Stärken gekrümmt sein. Sie können auch versetzt sein, was dann zu einem gewellten Aussehen führt.
Matrox SureDotOCR, ein kürzlich vorgestelltes innovatives Software Tool, geht speziell diese Probleme beim Lesen von Punkt-Matrix Text an, wie sie von industriellen Tintendruckern erzeugt und in der Praxis häufig anzutreffen sind. Im Unterschied zu klassischen OCR Tools zum Lesen durchgängiger Zeichen umgeht es die Notwendigkeit von Vorverarbeitungsschritten und ist unkompliziert in der Anwendung. Der Anwender muss gerade mal die erwartete Punktgröße (Durchmesser) sowie die Dimensionen des Rahmens um den zu lesenden Text angeben. Die Angabe der genauen Position der Zeichenfolge ist nicht notwendig, die Software erledigt den Rest. Durch die geringe Anzahl von Parametern ist die Zeit zum Justieren der Software bis zum erfolgreichen Lesen minimal.
Das Tool verkraftet ungleichmäßigen Punktabstand, der sich aus Kompression, Dehnung und Scherung ergibt, sowie unterschiedliche Zeichenhöhen. Es findet auch Text auf ungleichförmigem Hintergrund oder bei ungleichmäßiger Beleuchtung, und erkennt unter beliebigem Winkel gedrehten Text.
In vielen Fällen ist der zu lesende Text inhaltlich limitiert. Die Wahl an möglichen Zeichen ist dann an der jeweiligen Position nur eine Untermenge aller möglichen Zeichen, so z.B. beim Ablaufdatum Monat und Jahr. Matrox SureDotOCR berücksichtigt daher zur weiteren Verbesserung der Lesegenauigkeit diese Beschränkungen. Für jede Zeichenposition kann unabhängig eine eigene Regel angegeben werden, dass nur Buchstaben, nur Zahlen, spezielle Buchstaben, spezielle Zahlen, spezielle Sonderzeichen oder eine Kombination davon akzeptiert wird.
Das Tool hat vordefinierte Zeichensätze, erlaubt dem Anwender aber auch eigene Punkt-Matrix Zeichentabellen zu erstellen. Es liest auch mehrere Zeilen auf einmal, wobei jede Zeile ein anderer Zeichensatz sein kann.
SureDotOCR ist aktuell als Zusatz zur Matrox Imaging Library (MIL) Bildverarbeitungsbibliothek verfügbar.
Author: Pierantonio Boriero, Matrox Imaging
RAUSCHER
Johann-G.Gutenberg-Str. 20
D-82140 Olching
Tel 0 81 42 / 4 48 41-0
Fax 0 81 42 / 4 48 41-90
E.Mail: info@rauscher.de
www.rauscher.de