Audio Data Toolbox - WiGE

... Audiodatenmanagement

WiGE


Während Sie mit Sprachdaten arbeiten, um synthetische Stimmen zu erstellen, Spracherkenner zu trainieren, neue und aussagekräftige Merkmale im Sprachsignal zu suchen, müssen sie eine große Anzahl von Dateien mit Audiodaten, Labels und Merkmalen managen, die miteinander vielfach verknüpft sind. Sie müssen Abhängigkeiten beachten und viele Routineaufgaben durchführen. Um über die genannten Aufgaben den Überblick zu behalten und selbige zu vereinfachen, wurde WiGE entwickelt:

Merkmale

  • aufbauend auf einem flexiblen Gerüst in der weitverbreiteten Scriptsprache TCL
  • Möglichkeit der Aufspaltung des Arbeitsprozesses in verschiedene Klassen die für die Verwaltung von Sprachdaten von Bedeutung sind (Kontext, Elemente, Kollektionen, Export, etc.)
  • Beibehaltung der Verknüpfungen zwischen den Datentypen (Aus welchem Kontext kam dieses Element?)
  • Automatisierung von Routineaufgaben
  • automatische Listenerstellung von verschiedenen Elementen (diphone, triphone) aus dem Kontext heraus
  • Vielfältige Suchmöglichkeiten
  • Benutzung des wavesurfer von KTH um Audiodaten tiefgehend zu analysieren
  • Unterstützung von vielen Formaten: wav, bin, au, phondat,
  • Labelung von: ESPS, phondat, HTK und anderen Audiodaten

Die derzeitigen Merkmale können bei Bedarf leicht erweitert und auf Ihre Bedürfnisse zugeschnitten werden. WiGE hilft Ihnen, sich auf die wesentlichen Aufgaben zu konzentrieren!