Sprach- und Audiosignalverarbeitung

Sprache ist nicht nur das wichtigste Medium zwischenmenschlicher Kommunikation, sondern ist auch für sprachgesteuerte Mensch-Maschine-Schnittstellen von großer Bedeutung. In beiden Fällen spielt die Signalverarbeitung in den technischen Anwendungen eine große Rolle. Das Institut für Kommunikationsakustik arbeitet intensiv an Projekten im Bereich der Sprach- und Audiosignalverarbeitung, des maschinellen Lernens, und der Hörforschung. Studierenden bietet sich die Möglichkeit, im Rahmen von Studien- Bachelor- und Masterarbeiten diesen Projekten beizutragen und somit neue Technologien aktiv zu gestalten.

Das Forschungsgebiet umfasst eine Reihe von Aufgabenfeldern, u.a. die

Bild 1 zeigt, wie die Algorithmen der Sprachsignalverarbeitung z. B. in einem Smart-Phone zusammenwirken. Das akustische Sprachsignal wird von mehreren zu einem Mikrofonarray zusammengeschalteten Mikrofonen aufgenommen. Das Mikrofonarray erlaubt eine richtungsabhängige Selektion der Nutzsignalanteile und eine Unterdrückung störender Geräusche. Es erfordert in der Regel a priori Wissen über die Sprecherposition und kann mit einer automatischen Sprecherlokalisation kombiniert werden. Ferner können auch so genannte "blinde" Verfahren eingesetzt werden, die ohne Kenntnis der Positionen eine Trennung der Quellen herbeiführen.

Algotithmen der Sprachkommunikation
Bild 1: Algorithmen der Sprachkommunikation

Mit dem Mikrofonarray wird häufig eine Geräuschreduktion (Trennung von Nutz- und Störschall aufgrund statistischer Merkmale) und eine Echokompensation verbunden. Das so aufbereitete Signal wird nun entweder komprimiert, mit Fehlerschutz versehen und übertragen (z. B. über einen Mobilfunkkanal) oder aber einer sprachgesteuerten Mensch-Maschine-Schnittstelle zugeführt.