Während Sie mit Sprachdaten arbeiten, um synthetische Stimmen zu erstellen, Spracherkenner zu trainieren, neue und aussagekräftige Merkmale im Sprachsignal zu suchen, müssen sie eine große Anzahl von Dateien mit Audiodaten, Labels und Merkmalen managen, die miteinander vielfach verknüpft sind. Sie müssen Abhängigkeiten beachten und viele Routineaufgaben durchführen. Um über die genannten Aufgaben den Überblick zu behalten und selbige zu vereinfachen, wurde WiGE entwickelt:
Merkmale
- aufbauend auf einem flexiblen Gerüst in der weitverbreiteten
Scriptsprache TCL
- Möglichkeit der Aufspaltung des Arbeitsprozesses in verschiedene
Klassen die für die Verwaltung von Sprachdaten von Bedeutung sind
(Kontext, Elemente, Kollektionen, Export, etc.)
- Beibehaltung der Verknüpfungen zwischen den Datentypen (Aus welchem
Kontext kam dieses Element?)
- Automatisierung von Routineaufgaben
- automatische Listenerstellung von verschiedenen Elementen (diphone,
triphone) aus dem Kontext heraus
- Vielfältige Suchmöglichkeiten
- Benutzung des wavesurfer von KTH um Audiodaten tiefgehend zu
analysieren
- Unterstützung von vielen Formaten: wav, bin, au, phondat,
- Labelung von: ESPS, phondat, HTK und anderen Audiodaten
Die derzeitigen Merkmale können bei Bedarf leicht erweitert und auf
Ihre Bedürfnisse zugeschnitten werden. WiGE hilft Ihnen, sich auf die
wesentlichen Aufgaben zu konzentrieren!