Sprach- und Audiosignalverarbeitung

Sprache ist nicht nur das wichtigste Medium zwischenmenschlicher Kommunikation, sondern ist auch für sprachgesteuerte Mensch-Maschine-Schnittstellen von großer Bedeutung. In beiden Fällen spielt die Signalverarbeitung in den technischen Anwendungen eine große Rolle. Das Institut für Kommunikationsakustik arbeitet intensiv an Projekten im Bereich der Sprach- und Audiosignalverarbeitung. Studierenden bietet sich die Möglichkeit, im Rahmen von Studien- Bachelor- und Masterarbeiten diesen Projekten beizutragen und somit neue Technologien aktiv zu gestalten.

Das Forschungsgebiet der Sprachsignalverarbeitung umfasst eine Reihe von Aufgabenfeldern, u.a. die


Bild 1 zeigt, wie die Algorithmen der Sprachsignalverarbeitung zusammenwirken. Das akustische Sprachsignal wird von mehreren zu einem Mikrofonarray zusammengeschalteten Mikrofonen aufgenommen. Das Mikrofonarray erlaubt eine richtungsabhängige Selektion der Nutzsignalanteile und eine Unterdrückung störender Geräusche. Es erfordert in der Regel a priori Wissen über die Sprecherposition und kann mit einer automatischen Sprecherlokalisation kombiniert werden. Ferner können auch so genannte "blinde" Verfahren eingesetzt werden, die ohne Kenntnis der Positionen eine Trennung der Quellen herbeiführen.

Algotithmen der Sprachkommunikation
Bild 1: Algorithmen der Sprachkommunikation

 

Mit dem Mikrofonarray wird häufig eine Geräuschreduktion (Trennung von Nutz- und Störschall aufgrund statistischer Merkmale) und eine Echokompensation verbunden. Das so aufbereitete Signal wird nun entweder komprimiert, mit Fehlerschutz versehen und übertragen (z. B. über einen Mobilfunkkanal) oder aber einer sprachgesteuerten Mensch-Maschine-Schnittstelle zugeführt.

Am Institut für Kommunikationsakustik wird die multimodale Kommunikation u.a. im Zusammenhang mit virtuellen Umgebungen untersucht. Z.B. ist in jüngster Zeit eine interaktive Umgebung entstanden, die in einen Web-Browser geladen und ausgeführt werden kann.