Akustische Echokompensation (AEC)

Algorithmen im Vergleich

Einleitung

 

Sicher kennen Sie die Situation, in der Sie ein Telefonat führen oder sich z.B. über eine Gegensprechstelle unterhalten und Sie hören sich mit einer kleinen Verzögerung selbst aus dem Lautsprecher. Das Echo führt dazu, dass die Verständigung schwieriger wird oder das Gespräch mitunter ins Stocken gerät.

Es entsteht vor allem durch Übersprechen vom Lautsprecher ins Mikrofon Ihres Gesprächspartners am anderen Ende der Leitung und wird besonders stark, wenn Freisprecheinrichtungen im Spiel sind. Um dieses Echo zu unterdrücken, sollte vor allem in Freisprechsystemen eine akustische Echokompensation (engl. Acoustic Echo Cancellation – AEC) integriert werden.

Um die Qualität unserer AEC im direkten Vergleich zu einem Wettbewerber zu bewerten, haben wir einige Vergleichsmessungen in unserem Akustiklabor durchgeführt. Zum Einsatz kam dafür der vicCOM-complete 2 Systembausatz und das Wettbewerbsprodukt mit ähnlichem Leistungsumfang aus dem gleichen Preissegment.

Testaufbau und Messung der Frequenzgänge

Der prinzipielle Testaufbau folgte diesem Schema:

Messaufbau Akustische Echokompensation

Für einen ersten, grundlegenden Vergleich der beiden Hardware-Varianten wurden zunächst die Frequenzgänge des Mikrofon- und Lautsprecherpfads gemessen.

Messung des Frequenzgangs vom Mikrofonpfad

Für die Messung des Mikrofonpfads wurde das elektrische Messsignal am Mic-In eingespeist und am Line-Out gemessen.

Frequenzgang Mikrofonpfad (blau - vicCOM-complete 2, rot - Wettbewerbsprodukt)

Wie in den Messkurven sehr gut zu sehen ist, fällt der Mikrofonpegel beim Vergleichsprodukt (rot) zu tiefen Frequenzen hin sehr stark ab. Dies resultiert in einem sehr dünnen, nasalen Klang, was für den Hörer besonders bei hohen Pegeln sehr anstrengend ist. Zusätzlich leidet die Sprachverständlichkeit, da die Grundtöne des Sprachsignals sehr stark gedämpft werden.

Auch beim vicCOM-complete 2 (blau) ist ein Abfall des Frequenzgangs im niederfrequenten Bereich zu sehen, allerdings fällt dieser relativ gering aus. Diese Dämpfung des unteren Frequenzbereichs wird durch ein Hochpassfilter verursacht, welches in Audiosystemen verwendet wird, um Gleichspannungsanteile des Signals zu beseitigen. Diese würden sonst bei der Digitalisierung des Signals stören.

Im oberen Frequenzbereich sind keine signifikanten Unterschiede festzustellen. Da beide Systeme mit einer Abtastrate von 16 kHz arbeiten, liegt die obere Grenzfrequenz bei knapp 8 kHz. Beide Plattformen sind also für HD-Telefonie geeignet.

Messung des Frequenzgangs vom Lautsprecherpfad

Die Messung erfolgte dieses Mal vom Line-In zum Spk-Out.

Frequenzgang Lautsprecherpfad (blau - vicCOM-complete 2, rot - Wettbewerbsprodukt)

Der Unterschied zwischen den Frequenzgängen am Lautsprecherausgang ist geringer als beim Mikrofonpfad, aber trotzdem deutlich sicht- und und vor allem auch hörbar. Auch hier ist der Abfall der Messkurve beim System unseres Wettbewerbers (rot) deutlich stärker als beim vicCOM-complete 2 (blau). Dies führt folglich zu einer deutlich hörbar schwächeren Basswiedergabe mit den bereits oben genannten Auswirkungen auf Klangempfinden und Sprachverständlichkeit.

Wenden wir uns nun als nächstes dem Vergleich der AEC-Algorithmen zu.

 

Vergleich der AEC-Algorithmen

Um dieses Thema anschaulicher zu beschreiben, haben wir für Sie verschiedene Hörbeispiele erzeugt. Diese wurden für beide Plattformen jeweils unter identischen akustischen Rahmenbedingungen aufgenommen.

Damit Sie verschiedene Effekte gut nachvollziehen können, zeigen wir zuerst das Signal, welches am nahen Ende ankommt ohne Signalverarbeitung und anschließend mit aktiviertem Algorithmus. Am besten lassen sich die Unterschiede der beiden Systeme über Kopfhörer beurteilen.

 

Single Talk

Zuerst widmen wir uns der Echounterdrückung im „single talk“. Dies bedeutet, dass nur der ferne Sprecher spricht und die akustische Echokompensation das Echo am nahen Ende unterdrücken muss.

Wettbewerber ohne Akustische Echokompensation
vicCOM-complete 2 ohne Akustische Echokompensation

Für dieses Beispiel haben wir bewusst kein reelles, sondern ein künstliches Testsignal verwendet, da sich hier die Klangfärbung der Systeme durch den Frequenzgang des Lautsprechers gut nachvollziehen lässt. Es ist gut zu hören, dass das Signal am fernen Ende der Vergleichsplattform mittenlastig und unausgewogen klingt.

Wettbewerber mit Akustischer Echokompensation
vicCOM-complete 2 mit Akustischer Echokompensation

Sie hören richtig, wenn Sie an dieser Stelle nicht viel hören. Zumindest fast nichts, denn genau darum geht es ja bei einer akustischen Echokompensation. Das Signal des fernen Sprechers wird bei beiden Systemen bis zum Pegel des Grundrauschens reduziert. Der Plattform unseres Konkurrenten gelingt dies sogar noch ein klein wenig besser. Ein Restecho wie dieses ist allerdings für die Sprachverständlichkeit unkritisch. Bedenken Sie, dass der ferne Sprecher ein Echo seiner eigenen Worte hört und zwar während er spricht. Dieses extrem leise Restecho wird also durch den Sprecher selbst zusätzlich maskiert, so dass es unter der Wahrnehmungsschwelle bleibt.

Double Talk

"Double talk"-Situationen sind solche, in denen beide Sprecher gleichzeitig sprechen. Hier zeigt sich die Qualität einer Akustischen Echokompensation, da der Algorithmus das Signal des fernen Sprechers idealerweise vollständig unterdrückt, gleichzeitig jedoch das Signal des nahen Sprechers unverändert weiterleitet.

Im folgenden Beispiel stellt die weibliche Stimme die zu unterdrückende ferne Sprecherin dar. Der männliche Sprecher am nahen Ende soll möglichst wenig verändert zum fernen Ende übertragen werden.

Der große Pegelunterschied ergibt sich durch die Rückkopplung der Sprechstelle. Beide Sprecher sind auf einen Pegel von 60 dB(A) in einem Abstand von 25 cm eingemessen worden. Da Mikrofon und Lautsprecher einer Sprechstelle jedoch üblicherweise näher beieinander liegen, ist der zu unterdrückende Signalpegel häufig deutlich über dem des eigentlichen Nutzsignals. Dies stellt neben der Überlagerung der Signale eine weitere, nicht zu unterschätzende Herausforderung für die Signalverarbeitung dar.

Die Aufnahmen geben das Bild am fernen Ende der Übertragung wider.

Wettbewerber ohne Akustische Echokompensation
vicCOM-complete 2 ohne Akustische Echokompensation

Auch hier ist wieder die unterschiedliche Klangfärbung der Plattformen hörbar. Schon im unbearbeiteten Signal wird das Problem des Frequenzgangs deutlich. Beim Vergleichsprodukt ist der männliche, nahe Sprecher aufgrund des fehlenden Bass-Anteils schwer zu verstehen. Beim vicCOM-complete2 fällt es dagegen leichter, dem Gespräch zu folgen.

Wettbewerber mit Akustischer Echokompensation
vicCOM-complete 2 mit Akustischer Echokompensation

Bei aktivierter Signalverarbeitung sind die Unterschiede zwischen beiden Plattformen deutlich zu hören. Im ersten Teil (vom Start bis Sekunde 4), der eine single talk Situation darstellt, wird die ferne Sprecherin nahezu vollständig unterdrückt.

Im folgenden Bereich (von 4 bis 12 Sekunden), in dem sich beide Sprecher überlagern, wird der Qualitätsunterschied der AEC sehr deutlich. Beim Vergleichprodukt sind deutliche Aussetzer, sporadisch auftauchende Echo-Artefakte der fernen Sprecherin und eine starke Modulation des nahen Sprechers zu hören.

Beim vicCOM-complete 2 ist der nahe Sprecher hingegen ohne Aussetzer zu hören. Der Klang ist ausgewogen und nur sehr leicht moduliert. In Sprechpausen ist das Echo der fernen Sprecherin sehr leise, was dem Pegel im ersten Teil entspricht. Es sind jedoch keine störenden Echo-Artefakte enthalten.

Im letzten Teil der Aufnahmen (ab 12 Sekunden bis zum Ende), ist nur der Sprecher vom nahen Ende zu hören. Dieser Teil des Gesprächs sollte in optimaler Qualität übertragen werden, da dies das eigentliche Nutzsignal darstellt. Bei der Vergleichsplattform ist eine deutliche Verbesserung des Signals zu erkennen, allerdings bleibt der mittenlastige, nasale Klang erhalten, was vor allem auf den Frequenzgang des Mikrofonpfads zurückzuführen ist.

Beim vicCOM-complete 2 ist eine leichte, aber nicht grundlegende Änderung des Klangs zu erkennen. Aufgrund der Komplexität der Problemstellung - zwei überlagerte, ungleich laute Signale voneinander zu trennen - wird der Klang des nahen Sprechers durch die AEC leicht beeinflusst. Im letzten Teil zeigt sich dann die volle Signalqualität mit einem sehr ausgewogenen Klangbild.

Fazit

Beim Vergleich des vicCOM-complete 2 mit einem Konkurrenzprodukt des gleichen Preissegments kann sich unsere Hardware-Plattform in fast allen verglichenen Szenarien eindeutig durchsetzen. So führt der geringe Abfall des Mikrofon- und des Lautsprecherfrequenzgangs zu einem ausgewogenen Klangbild mit guter Sprachverständlichkeit am nahen und fernen Ende. Die Akustische Echokompensation beider Plattformen liefert in Single-Talk-Situationen sehr gute Ergebnisse. Im Double Talk liegt das vicCOM-complete 2 mit vicHSES (Hands-free and Speech Enhancement Suite) deutlich vorn und kann mit hoher Klangqualität und einer sehr guten Signaltrennung punkten.

Einen Kommentar schreiben

Was ist die Summe aus 2 und 5?

Zurück

Weitere Blogbeiträge

Bauanleitung für einen Dart-Scorer

Projektarbeiten im Rahmen des Dualen Studiums für Informationstechnik können mitunter ganz kurzweilig und praxisnah sein. Warum nicht mal Hobby und Studium vereinen? Lesen Sie in unserem Blogbeitrag, wie man mit einfachen Mitteln einen Dart-Scorer baut.

Akustische Echokompensation (AEC)

Sie führen ein Telefonat oder eine Unterhaltung über eine Gegensprechstelle - und hören sich dabei mit einer kleinen Verzögerung selbst aus dem Lautsprecher. Das Echo führt dazu, dass die Verständigung zunehmend schwieriger wird oder das Gespräch mitunter ins Stocken gerät. Wie lässt sich dieses Problem lösen?

 

Eine Sprachsteuerung für den Magic Mirror

Zum Tag der offenen Tür präsentierten wir unseren Besuchern etwas ganz Besonderes: einen "Magic Mirror" mit einer Sprachsteuerung von Amazon Alexa und einem Raspberry Pi. Lesen Sie mehr darüber in unserer Bauanleitung.

Fragen?

+49 351 40752650
E-Mail senden