Sprechpausenerkennung

... Erkennung von Stimmaktivität (Voice Activity Detection - VAD)

Robuste Stimmaktivitätserkennung (VAD) ist die Voraussetzung für effektive und robuste Anwendungen zur Audio-Überwachung, Sprachkommunikation und -übertragung, Sprachsteuerung technischer Geräte sowie zur Realisierung von weiteren Algorithmen wie der Störgeräuschunterdrückung, der akustischen Echokompensation oder Mikrofon-Arrays.

Die Komponenten zur Stimmaktivitätserkennung (VAD) sowie zur Störgeräuschunterdrückung (ANR) wurden unter der Forderung nach höchster Robustheit gegen widrige Umgebungsbedingungen und mit minimalem Speicher- bzw. Rechenbedarf entwickelt. Sie vereinigen proprietäre Verfahren im Zeit- und im Frequenzbereich, welche zum Teil patentiert sind. Die Algorithmen adaptieren sich automatisch an neue Umgebungsbedingungen. Ihre Verfügbarkeit ist sehr hoch, da die Algorithmen vielfach in praktischen integrierten Anwendungen für Maschinensteuerungen erprobt wurden sowie einer kontinuierlichen Pflege und Qualitätsüberwachung unterliegen.

Merkmale der Stimmaktivitätserkennung

  • Rasche Adaption auf wechselnden Umgebungsbedingungen
  • Funktionsfähig bei Lärm, hohe Klarheit und Verständlichkeit durch integrierte Störunterdrückung
  • Robuste Detektion von energieschwachen Sprachanteilen wie z.B. Frikative, keine verschluckten Wortanfänge
  • Minimaler Ressourcenbedarf, Einsatz in Mikrocontrollern möglich
  • Robuste, patentierte Verfahren zur Stimmaktivitätserkennung (VAD)
  • Reduziert die Systemlast bei Sprachübertragung und –erkennung
  • Basistechnologie für eine Vielzahl von sprachbasierten Anwendungen
  • Selbständige Adaption an Hintergrundgeräusche
  • Integration mit Störgeräuschunterdrückung
  • Minimaler Ressourcenbedarf (ca. 7 MIPS, 4 KB Speicher)
  • Kontinuierliche Adaption und Echtzeit-Konvergenz (<200 ms)
  • Zuverlässige Funktion auch bei starken Störgeräuschen (SNR >0 dB)
  • ANSI C mit Hardware-Abstraction Layer, Lieferung als:
  • Objektcode für spezifische DSP Umgebungen
  • DLL oder Static Library für WIN und LINUX Umgebungen
  • Parameter-Interface zur Integration des VAD in die Zielapplikation
  • Plattformen:
  • Blackfin ADSP 2153x, ADSP 2191, WINDOWS, Linux (DLL, static library)

Anpassungsmöglichkeiten der Stimmaktivitätserkennung

Zusätzlich zu den integrierten automatischen Adaptionsverfahren an Hintergrundgeräusche können die Algorithmen durch geeignete Parameterwahl bzw. Automatische Situationserkennung (z.B. Umschalten zwischen Frequenz- und Zeit-VAD, Schwellenanpassung etc.) weiter an Aufgabenstellungen angepasst werden.

Sie profitieren von den langjährigen Erfahrungen der voice INTER connect bei Algorithmen und Applikationen in den Bereichen Automotive und Fahrzeugkommunikation, Telekommunikation, Gebäudetechnik und Consumer-Elektronik.