Wie misst man Sprachverständlichkeit?

Ausgangspunkt

Soll Sprache über Kommunikationsgeräte oder Beschallungsanlagen übertragen werden, so liegt der Fokus vor allem auf einer optimalen Verständlichkeit des wiedergegebenen Signals. Jeder kennt die Situation, seinen Gesprächspartner z.B. an Türsprechstellen oder Durchsagen im öffentlichen Nahverkehr schlecht zu verstehen. Dabei kann eine Vielzahl von Einflussgrößen eine Rolle spielen, die ein klares Sprachsignal in unverständliches Durcheinander verwandeln.
Bei der Entwicklung und Einrichtung eines solchen Systems stellen sich also einige Fragen:

  • Welche Parameter haben Einfluss auf die Sprachverständlichkeit?
  • Wie kann die Verständlichkeit eines Sprachsignals messtechnisch ermittelt werden?
  • Wie kann die Sprachverständlichkeit eines Übertragungssystems optimiert werden?

Einflussgrößen

Aus eigener Erfahrung kennen die meisten Menschen bereits die wichtigsten Parameter, die zu einer Verschlechterung der Sprachverständlichkeit führen.

  • Zu niedriger, schwankender oder zu hoher Signalpegel
  • Laute Störgeräusche
  • Nachhall
  • Übersteuertes Signal
  • Eingeschränktes Frequenzspektrum
  • Maskierungseffekte

Da die subjektive Wahrnehmung des Hörers in der Akustik häufig eine entscheidende Rolle spielt, ist es wichtig, objektive und reproduzierbare Bewertungskriterien anwenden zu können. Bei der Betrachtung der Sprachverständlichkeit ist dies durch die Messung des Speech Transmission Index möglich, welcher in der DIN EN 60268-16 beschrieben wird. Mithilfe des STI kann die Sprachübertragungsqualität eines Übertragungskanals bestimmt und daraus eine Vorhersage für die Sprachverständlichkeit abgeleitet werden.

Beschreibung des Messverfahrens

Die Messung des Speech Transmission Index basiert auf der empirischen Feststellung, dass die Sprachverständlichkeit hauptsächlich durch die Stärke der Intensitätsschwankungen (Modulation) von Sprachsignalen bestimmt wird. Diese Schwankungen ergeben sich bei reeller Sprache durch die akustische Trennung von Sätzen, Wörtern und Phonemen. Je ausgeprägter die gemessene Modulation, desto verständlicher ist das Sprachsignal.

In der folgenden Grafik ist ein vereinfachter STI-Messaufbau dargestellt. Links die Messung des Mikrofonsignalwegs und rechts die des Lautsprechers.


Der STI kann direkt oder indirekt gemessen werden, wobei sich die Verfahren in der Art des Testsignals und ihrer Anwendbarkeit unterscheiden. Bei der direkten Messung wird ein sprachähnliches Rauschen verwendet, das in 7 Oktav-Frequenzbändern von 0,125 - 8 kHz mit jeweils 14 Modulationsfrequenzen im Bereich 0,63 – 12,5 Hz moduliert wird. Daraus ergeben sich 98 Messwerte, aus denen der STI direkt errechnet werden kann. Beim indirekten Verfahren wird die Impulsantwort des Übertragungssystems mittels eines geeigneten Testsignals gemessen und der STI mittels mathematischer Verfahren daraus abgeleitet. Bei beiden Varianten ergibt sich final ein Wert zwischen 0 und 1, der direkt Auskunft über die Qualität der Sprachverständlichkeit gibt.

Als verkürztes Verfahren wurde außerdem der Speech Transmission Index for Public Adress systems (STIPA) eingeführt, welcher aus nur 14 statt 98 Werten einer direkten Messung berechnet wird. Hier liegt der Fokus auf einer Verkürzung der Messdauer, wodurch jedoch Einschränkungen z.B. beim Auftreten nichtlinearer Verzerrungen und bei der Abschätzung für weibliche Sprecher beachtet werden müssen. Weiterhin existiert der Room Acoustical Speech Transmission Index (RASTI), der jedoch veraltet ist und nicht mehr angewendet werden sollte.

Vergleich der Indizes

  STI STIPA RASTI
Oktavbänder 7 7 2
Modulations-frequenzen 14 2 4/5
Kombinationen 98 14 9
Vorteile hohe Genauigkeit hohe Messgeschwindigkeit hohe Messgeschwindigkeit
Nachteile leicht erhöhte Messzeit fehleranfällig bei impulsartigen Störgeräuschen veraltetes Messverfahren
    sensibel bei nichtlinearen Verzerrungen fehleranfällig bei impulsartigen Störgeräuschen
      fehleranfällig bei tonhaltigen Störgeräuschen
      fehleranfällig bei komprimierten Signalen

Wie bei jeder qualifizierten Messung ist es wichtig mit kalibrierten und ausreichend genauen Messmitteln zu arbeiten. Dabei müssen jegliche Einflüsse, die einen Einfluss auf das Messergebnis haben könnten durch die Auswahl der Messmittel minimiert werden. Verzerrungsarme Messmikrofone und Messlautsprecher mit einem möglichst ideal flachen Frequenzgang sind eine Voraussetzung für belastbare Ergebnisse. Die Messung selbst erfolgt dann entweder computerbasiert oder mittels eines entsprechenden Analyzers.

Erfahrungen und Optimierung

Bei der Optimierung von Kommunikationssystemen ist die Sprachverständlichkeit in hohem Maße von den räumlichen Bedingungen und der Position des Hörers abhängig. So wird hier üblicherweise vorrangig die Positionierung und Ausrichtung von Lautsprechern oder der gezielte Einsatz von Absorbern und Diffusoren zur Verbesserung der Raumakustik betrachtet. Doch auch unter kontrollierten akustischen Bedingungen im reflexionsarmen Messraum kann die Messung des STI nützliche, gerätespezifische Erkenntnisse mit sich bringen.

Besonders bei Sprachkommunikationssystemen, die nicht für die Beschallung großer Räume konzipiert werden, spielen häufig eine Vielzahl von Aspekten eine maßgebliche Rolle. So führen Designvorgaben in Verbindung mit einer großen Funktionsvielfalt und gegebenen ökonomischen Rahmenbedingungen häufig zu Produkten, deren Frequenzgang und Klirrverhalten alles andere als ideal ist. Hier konnten wir durch die Messung der Sprachverständlichkeit auch bei ungünstigen Werten der Standardparameter nachweisen, dass die Sprachverständlichkeit entgegen den Erwartungen überraschend gut war. Durch das Einspielen typischer Störgeräusche für den geplanten Einsatzzweck kann weiterhin das Verhalten bei verschiedenen Signal-Störgeräusch-Abständen ermittelt werden.

Aber auch die Identifizierung von Schwachstellen oder Serienstreuungen ist in Kombination mit weiteren Messungen möglich. So konnte z.B. bei einem Handmontageprozess eines Intercoms eine sporadisch auftretende Beschädigung eines Lautsprechers festgestellt werden, der sich erst bei hohen Wiedergabepegeln negativ bemerkbar machte. Weiterhin ist es möglich die Auswirkungen von ungünstig parametrierten digitalen Signalverabreitungsschritten oder Änderungen am Gerätedesign, Material oder Komponenten direkt nachvollziehen zu können und die Sprachverständlichkeit durch gezielte Parametrierung, Variation einzelner Bauteile oder konstruktive Maßnahmen zu optimieren.

Einen Kommentar schreiben

Bitte rechnen Sie 1 plus 6.

Zurück

Weitere Blogbeiträge

Effizientes Testen von MEMS Mikrofonmodulen

Präzise Messungen und wirksame Störgeräuschisolation

MEMS Mikrofonmodule sind aus der modernen Audiotechnologie nicht mehr wegzudenken. Sie finden Anwendung in Smartphones, Wearables oder IoT-Geräten. Wie prüft man am besten Qualität und Zuverlässigkeit dieser Mikrofone? Lesen Sie dazu unseren Fachbeitrag.

Sprache verbindet: 20 Jahre voice INTER connect

Pionierarbeit für Sprachbedienung, Kommunikation und künstliche Intelligenz

Faszination für Sprachtechnologie, Unternehmergeist und die Vision, Mensch-Maschinen-Kommunikation mit Sprachbedienung zu revolutionieren: Daraus entstand 2001 voice INTER connect.

Schnelle Entwicklung, klare Verständigung

Laute, wechselnde Hintergrundgeräusche, raue Umgebungsbedingungen und hohe Ansprüche an Dienstgüte, Ausfallsicherheit und Schutz vor Cyberattacken: Moderne Leit- und Informationssysteme müssen vielfältigen Anforderungen gewachsen sein. Erfahren Sie im Artikel, wie dies mit vicCOM IP gelingt.

Fragen?

+49 351 40752650
E-Mail senden