Sprach-Pause-Erkennung

Robuste Stimmaktivitätserkennung (VAD) ist die Voraussetzung für effektive und robuste Anwendungen zur Audio-Überwachung, Sprachkommunikation und -übertragung, Sprachsteuerung technischer Geräte sowie zur Realisierung von weiteren Algorithmen wie Störgeräuschunterdrückung, Akustische Echokompensation, Mikrofon-Arrays uvm. Die Komponenten zur Stimmaktivitätserkennung (VAD) sowie zur Störgeräuschunterdrückung (ANR) wurden unter der Forderung nach höchster Robustheit gegen widrige Umgebungsbedingungen, sowie mit minimalem Speicher- bzw. Rechenbedarf entwickelt, und vereinigen proprietäre Verfahren im Zeit- und im Frequenzbereich, welche zum Teil patentiert sind. Die Algorithmen adaptieren sich automatisch an neue Umgebungsbedingungen und zeichnen sich durch hohe Robustheit aus. Die Verfügbarkeit ist sehr hoch, da die Algorithmen vielfach in praktischen integrierten Anwendungen für Maschinensteuerungen erprobt wurden, und einer kontinuierlichen Pflege und Qualitätsüberwachung unterliegen.

 

Merkmale

nach oben
  • rasche Adaption auf wechselnden Umgebungsbedingungen
  • funktionsfähig bei Lärm, hohe Klarheit und Verständlichkeit durch integrierte Störunterdrückung
  • robuste Detektion von energieschwachen Sprachanteilen wie z.B. Frikative, keine verschluckten Wortanfänge
  • minimaler Ressourcenbedarf, Einsatz in Mikrocontrollern möglich
  • robuste, patentierte Verfahren zur Stimmaktivitätserkennung (VAD)
  • reduziert die Systemlast bei Sprachübertragung und –erkennung
  • Basistechnologie für eine Vielzahl von sprachbasierten Anwendungen
  • selbständige Adaption an Hintergrundgeräusche
  • Integration mit Störgeräuschunterdrückung
  • minimaler Ressourcenbedarf (ca. 7 MIPS, 4 KB Speicher)
  • kontinuierliche Adaption und Echtzeit-Konvergenz (<200 ms)
  • zuverlässige Funktion auch bei starken Störgeräuschen (SNR >0 dB)
  • ANSI C mit Hardware-Abstraction Layer, Lieferung als:
  • Objektcode für spezifische DSP Umgebungen
  • DLL oder Static Library für WIN und LINUX Umgebungen
  • Parameter-Interface zur Integration des VAD in die Zielapplikation
  • Plattformen:
  • Blackfin ADSP 2153x, ADSP 2191, WINDOWS, Linux (DLL, static library)

Zusätzliche Informationen

nach oben

Zusätzlich zu den integrierten automatischen Adaptionsverfahren an Hintergrundgeräusche können die Algorithmen durch geeignete Parameterwahl bzw. Automatische Situationserkennung (z.B. Umschalten zwischen Frequenz- und Zeit-VAD, Schwellenanpassung etc.) weiter an Aufgabenstellungen angepasst werden.

Sie profitieren von den langjährigen Erfahrungen der voice INTER connect bei Algorithmen und Applikationen in den Bereichen Automotive und Fahrzeugkommunikation, Telekommunikation, Gebäudetechnik und Consumer-Elektronik.