Entwicklung automatischer Generator für multilinguale Wissensbasen für einen schnellen Phonemerkenner

Für das herkömmliche Training von Spracherkennern und die Optimierung vorhandener Spracherkenner auf Robustheit unter bestimmten Umweltbedigungen (auf öffentlichen Plätzen und in Bahnhofshallen, im Kfz, im Haushalt etc.) sind üblicherweise große Datenbanken notwendig. voice INTER connect hat dazu die WiGE-Toolbox weiterentwickelt, um den Automatisierungsgrad bei der Datenbankdefinition, bei der Aufzeichnung, beim Schnitt und bei der Aufbereitung der Daten zu erhöhen. Insbesondere lag der Schwerpunkt der Entwicklungsarbeiten in dem Bereich der automatisierten Qualitätskontrolle, wo Tools geschaffen wurden, die den Schnitt und die Etikettierung der Daten automatisch kontrollieren, und dem menschlichen Bearbeiter Inkonsistenzen in der Datenbank anzeigen, um die Korrektur zu erleichtern und zu beschleunigen.

Als Kernziel des Forschungsvorhabens wurden diese herkömmlichen Trainingsverfahren zu einem neuartigen Verfahren zur automatischen Generierung von Wissensbasen für neue Sprachen anhand der bereits gelernten alten Sprachen weiterentwickelt. Dieses Verfahren erstellt durch Aufteilung einer vorhandenen Wissensbasis und Umverteilung der akustischen Modelle einer vorhandenen Sprache sowie nachfolgender automatischer Adaption der Modelle anhand der gehörten Sprachmuster ein akustisches Modell der Zielsprache bereits während der Benutzung.

Weiterhin wurden neue Möglichkeiten der Versionskontrolle und automatisierten Dokumentation der Bearbeitungsschritte der Datenbank geschaffen, um zufällige Bearbeitungsfehler zu vermeiden und die Bearbeitung durch unqualifizierte Datenbankbearbeiter zu ermöglichen.

Im Rahmen des Förderprojektes wurde somit ein neues multilinguales Erkennerkonzept entwickelt und praktisch umgesetzt. Dabei wurde Knowhow aus dem Bereich Sprachsynthese eingebracht sowie ein neuartiges diskriminatives Trainingsverfahren entwickelt, mit dem die parallele Benutzung und die Adaption auf eine neue Sprache ermöglicht wird.

Außerdem wurden automatische Trainingstools zur Bearbeitung und Qualitätskontrolle der Sprachdatenbanken entwickelt, die eine rationellere Durchführung herkömmlicher Trainingsverfahren unterstützen und eine hohe Qualität der Sprachdatenbanken sichern sowie eine hohe Transparenz des Bearbeitungsverfahrens erlauben.

EFS Europa fördert Sachsen.

 

gefördert durch den
Europäischen Sozialfond

 

Europäische Union

 

gefördert durch die
Europäische Union