Acapelas Kunden und die Verwender von deren Produkten haben damit nunmehr die Wahl zwischen einer männlichen und einer weiblichen deutschen Stimme.
Die Sprachschnittstelle kann damit noch besser mit der passenden Persönlichkeit ausgestattet werden. Das Alternieren von männlicher und weiblicher Stimme erlaubt, die Navigation innerhalb interaktiver Menüs besser zu strukturieren und verschiedene Informationsniveaus einfacher zu unterscheiden. Ebenso können mit den Stimmen im Multimedia-Bereich vielfältigere Dialoge geschaffen werden.
Die Kreation der Stimme Klaus ist Teil einer umfassenden Entwicklung mit der Acapela den hohen Ansprüchen hinsichtlich Qualität und Natürlichkeit sowie den spezifischen Anforderungen in den verschiedenen Sektoren die Acapela bedient - Telekommunikation, Automobil, Accessibility, Multimedia, Mobilität – nachkommt.
Dank der neuen deutschen Stimme Klaus wird Acapela seine Präsenz im deutschen Sprachraum noch weiter ausbauen. Zu Acapelas prestigereichen Referenzen zählen unter anderem Klett (Produktreihe PONS) Karl Storz, Voxtron (für die CC Bank), das mehrfach ausgezeichnete Portal www.ich-will-schreiben-lernen.de, FunkTrans, Readspeaker, Siemens, Alcatel, Nabaztag, Tieman, Baum, Temic...
Um sich von Klaus einen eigenen Text in Echtzeit online vorlesen zu lassen, testen Sie die interaktive Demonstration an Acapelas Stand auf der CeBIT 2006.
Die Sprachsynthese kurz erklärt
Die Sprachsynthese (Text-to-Speech/ TTS) gibt jeden beliebigen Text in Echtzeit wieder. Sie liest diesen mit der Geschmeidigkeit und dem Nuancenreichtum einer natürlichen Stimme vor, und dies auf verschiedenen Sprachen. Die männliche oder weibliche Stimme moduliert die Geschwindigkeit sowie die Stimmlage und respektiert Pausen und Interpunktion. Die Sprachsynthese gibt allen Schnittstellen eine Stimme, und überträgt damit schriftliche Information in einen natürlichen Sprachfluss, der angenehm anzuhören ist und dem Nutzer höchsten Komfort bietet.
Die Herstellung der Sprachsynthese
Um den natürlichen Klang einer Sprache herzustellen, wird eine Reihe von Texten (Poesie, politische Texte, Sportberichterstattung, Börsenkurse,...), welche alle möglichen Tonalitäten einer Sprache enthalten, mit einem Sprecher aufgenommen. In der Folge werden die Aufnahmen zerstückelt und in einer akustischen Datenbank gespeichert. Um die Worte auf Grundlage eines Textes zu reproduzieren, verwendet das TTS System eine ausgefeilte sprachliche Analyse, die den schriftlichen Text in phonetische Sprache transponiert. Eine grammatische und syntaktische Analyse erlaubt in der Folge, jedem Wort die richtige Aussprache zu geben. Prosodie bezeichnet diesen Prozess, der den Sätzen den angemessenen Rhythmus und die passende Intonation gibt. Als letzter Schritt werden aus der akustischen Datenbank die adäquatesten Einheiten ausgewählt um die Synthese zum Sprechen zu bringen.