Sicher kennen Sie die Situation, in der Sie ein Telefonat führen oder sich z.B. über eine Gegensprechstelle unterhalten und Sie hören sich mit einer kleinen Verzögerung selbst aus dem Lautsprecher. Das Echo führt dazu, dass die Verständigung schwieriger wird oder das Gespräch mitunter ins Stocken gerät.
Es entsteht vor allem durch Übersprechen vom Lautsprecher ins Mikrofon Ihres Gesprächspartners am anderen Ende der Leitung und wird besonders stark, wenn Freisprecheinrichtungen im Spiel sind. Um dieses Echo zu unterdrücken, sollte vor allem in Freisprechsystemen eine akustische Echokompensation (engl. Acoustic Echo Cancellation – AEC) integriert werden.
Um die Qualität unserer AEC im direkten Vergleich zu einem Wettbewerber zu bewerten, haben wir einige Vergleichsmessungen in unserem Akustiklabor durchgeführt. Zum Einsatz kam dafür der vicCOM-complete 2 Systembausatz und das Wettbewerbsprodukt mit ähnlichem Leistungsumfang aus dem gleichen Preissegment.
Der prinzipielle Testaufbau folgte diesem Schema:
Für einen ersten, grundlegenden Vergleich der beiden Hardware-Varianten wurden zunächst die Frequenzgänge des Mikrofon- und Lautsprecherpfads gemessen.
Für die Messung des Mikrofonpfads wurde das elektrische Messsignal am Mic-In eingespeist und am Line-Out gemessen.
Wie in den Messkurven sehr gut zu sehen ist, fällt der Mikrofonpegel beim Vergleichsprodukt (rot) zu tiefen Frequenzen hin sehr stark ab. Dies resultiert in einem sehr dünnen, nasalen Klang, was für den Hörer besonders bei hohen Pegeln sehr anstrengend ist. Zusätzlich leidet die Sprachverständlichkeit, da die Grundtöne des Sprachsignals sehr stark gedämpft werden.
Auch beim vicCOM-complete 2 (blau) ist ein Abfall des Frequenzgangs im niederfrequenten Bereich zu sehen, allerdings fällt dieser relativ gering aus. Diese Dämpfung des unteren Frequenzbereichs wird durch ein Hochpassfilter verursacht, welches in Audiosystemen verwendet wird, um Gleichspannungsanteile des Signals zu beseitigen. Diese würden sonst bei der Digitalisierung des Signals stören.
Im oberen Frequenzbereich sind keine signifikanten Unterschiede festzustellen. Da beide Systeme mit einer Abtastrate von 16 kHz arbeiten, liegt die obere Grenzfrequenz bei knapp 8 kHz. Beide Plattformen sind also für HD-Telefonie geeignet.
Die Messung erfolgte dieses Mal vom Line-In zum Spk-Out.
Der Unterschied zwischen den Frequenzgängen am Lautsprecherausgang ist geringer als beim Mikrofonpfad, aber trotzdem deutlich sicht- und und vor allem auch hörbar. Auch hier ist der Abfall der Messkurve beim System unseres Wettbewerbers (rot) deutlich stärker als beim vicCOM-complete 2 (blau). Dies führt folglich zu einer deutlich hörbar schwächeren Basswiedergabe mit den bereits oben genannten Auswirkungen auf Klangempfinden und Sprachverständlichkeit.
Wenden wir uns nun als nächstes dem Vergleich der AEC-Algorithmen zu.
Um dieses Thema anschaulicher zu beschreiben, haben wir für Sie verschiedene Hörbeispiele erzeugt. Diese wurden für beide Plattformen jeweils unter identischen akustischen Rahmenbedingungen aufgenommen.
Damit Sie verschiedene Effekte gut nachvollziehen können, zeigen wir zuerst das Signal, welches am nahen Ende ankommt ohne Signalverarbeitung und anschließend mit aktiviertem Algorithmus. Am besten lassen sich die Unterschiede der beiden Systeme über Kopfhörer beurteilen.
Zuerst widmen wir uns der Echounterdrückung im „single talk“. Dies bedeutet, dass nur der ferne Sprecher spricht und die akustische Echokompensation das Echo am nahen Ende unterdrücken muss.
Für dieses Beispiel haben wir bewusst kein reelles, sondern ein künstliches Testsignal verwendet, da sich hier die Klangfärbung der Systeme durch den Frequenzgang des Lautsprechers gut nachvollziehen lässt. Es ist gut zu hören, dass das Signal am fernen Ende der Vergleichsplattform mittenlastig und unausgewogen klingt.
Sie hören richtig, wenn Sie an dieser Stelle nicht viel hören. Zumindest fast nichts, denn genau darum geht es ja bei einer akustischen Echokompensation. Das Signal des fernen Sprechers wird bei beiden Systemen bis zum Pegel des Grundrauschens reduziert. Der Plattform unseres Konkurrenten gelingt dies sogar noch ein klein wenig besser. Ein Restecho wie dieses ist allerdings für die Sprachverständlichkeit unkritisch. Bedenken Sie, dass der ferne Sprecher ein Echo seiner eigenen Worte hört und zwar während er spricht. Dieses extrem leise Restecho wird also durch den Sprecher selbst zusätzlich maskiert, so dass es unter der Wahrnehmungsschwelle bleibt.
"Double talk"-Situationen sind solche, in denen beide Sprecher gleichzeitig sprechen. Hier zeigt sich die Qualität einer Akustischen Echokompensation, da der Algorithmus das Signal des fernen Sprechers idealerweise vollständig unterdrückt, gleichzeitig jedoch das Signal des nahen Sprechers unverändert weiterleitet.
Im folgenden Beispiel stellt die weibliche Stimme die zu unterdrückende ferne Sprecherin dar. Der männliche Sprecher am nahen Ende soll möglichst wenig verändert zum fernen Ende übertragen werden.
Der große Pegelunterschied ergibt sich durch die Rückkopplung der Sprechstelle. Beide Sprecher sind auf einen Pegel von 60 dB(A) in einem Abstand von 25 cm eingemessen worden. Da Mikrofon und Lautsprecher einer Sprechstelle jedoch üblicherweise näher beieinander liegen, ist der zu unterdrückende Signalpegel häufig deutlich über dem des eigentlichen Nutzsignals. Dies stellt neben der Überlagerung der Signale eine weitere, nicht zu unterschätzende Herausforderung für die Signalverarbeitung dar.
Die Aufnahmen geben das Bild am fernen Ende der Übertragung wider.
Auch hier ist wieder die unterschiedliche Klangfärbung der Plattformen hörbar. Schon im unbearbeiteten Signal wird das Problem des Frequenzgangs deutlich. Beim Vergleichsprodukt ist der männliche, nahe Sprecher aufgrund des fehlenden Bass-Anteils schwer zu verstehen. Beim vicCOM-complete2 fällt es dagegen leichter, dem Gespräch zu folgen.
Bei aktivierter Signalverarbeitung sind die Unterschiede zwischen beiden Plattformen deutlich zu hören. Im ersten Teil (vom Start bis Sekunde 4), der eine single talk Situation darstellt, wird die ferne Sprecherin nahezu vollständig unterdrückt.
Im folgenden Bereich (von 4 bis 12 Sekunden), in dem sich beide Sprecher überlagern, wird der Qualitätsunterschied der AEC sehr deutlich. Beim Vergleichprodukt sind deutliche Aussetzer, sporadisch auftauchende Echo-Artefakte der fernen Sprecherin und eine starke Modulation des nahen Sprechers zu hören.
Beim vicCOM-complete 2 ist der nahe Sprecher hingegen ohne Aussetzer zu hören. Der Klang ist ausgewogen und nur sehr leicht moduliert. In Sprechpausen ist das Echo der fernen Sprecherin sehr leise, was dem Pegel im ersten Teil entspricht. Es sind jedoch keine störenden Echo-Artefakte enthalten.
Im letzten Teil der Aufnahmen (ab 12 Sekunden bis zum Ende), ist nur der Sprecher vom nahen Ende zu hören. Dieser Teil des Gesprächs sollte in optimaler Qualität übertragen werden, da dies das eigentliche Nutzsignal darstellt. Bei der Vergleichsplattform ist eine deutliche Verbesserung des Signals zu erkennen, allerdings bleibt der mittenlastige, nasale Klang erhalten, was vor allem auf den Frequenzgang des Mikrofonpfads zurückzuführen ist.
Beim vicCOM-complete 2 ist eine leichte, aber nicht grundlegende Änderung des Klangs zu erkennen. Aufgrund der Komplexität der Problemstellung - zwei überlagerte, ungleich laute Signale voneinander zu trennen - wird der Klang des nahen Sprechers durch die AEC leicht beeinflusst. Im letzten Teil zeigt sich dann die volle Signalqualität mit einem sehr ausgewogenen Klangbild.
Beim Vergleich des vicCOM-complete 2 mit einem Konkurrenzprodukt des gleichen Preissegments kann sich unsere Hardware-Plattform in fast allen verglichenen Szenarien eindeutig durchsetzen. So führt der geringe Abfall des Mikrofon- und des Lautsprecherfrequenzgangs zu einem ausgewogenen Klangbild mit guter Sprachverständlichkeit am nahen und fernen Ende. Die Akustische Echokompensation beider Plattformen liefert in Single-Talk-Situationen sehr gute Ergebnisse. Im Double Talk liegt das vicCOM-complete 2 mit vicHSES (Hands-free and Speech Enhancement Suite) deutlich vorn und kann mit hoher Klangqualität und einer sehr guten Signaltrennung punkten.
Präzise Messungen und wirksame Störgeräuschisolation
MEMS Mikrofonmodule sind aus der modernen Audiotechnologie nicht mehr wegzudenken. Sie finden Anwendung in Smartphones, Wearables oder IoT-Geräten. Wie prüft man am besten Qualität und Zuverlässigkeit dieser Mikrofone? Lesen Sie dazu unseren Fachbeitrag.
Pionierarbeit für Sprachbedienung, Kommunikation und künstliche Intelligenz
Faszination für Sprachtechnologie, Unternehmergeist und die Vision, Mensch-Maschinen-Kommunikation mit Sprachbedienung zu revolutionieren: Daraus entstand 2001 voice INTER connect.
Laute, wechselnde Hintergrundgeräusche, raue Umgebungsbedingungen und hohe Ansprüche an Dienstgüte, Ausfallsicherheit und Schutz vor Cyberattacken: Moderne Leit- und Informationssysteme müssen vielfältigen Anforderungen gewachsen sein. Erfahren Sie im Artikel, wie dies mit vicCOM IP gelingt.
+49 351 40752650
E-Mail senden
Einen Kommentar schreiben