RUB 

Sprechertrennung / Separation of Speech Sources

Problembeschreibung und Aufgabenstellung

In vielen Anwendungen der Sprachkommunikation werden gleichzeitig mehrere Sprachsignale  aufgenommen, von denen zumeist nur eines erwünscht ist, während die übrigen als störend empfunden werden und deshalb unterdrückt werden sollen.
Ein Hörgeräteträger möchte beispielsweise auf einer Party gezielt seinem Gesprächspartner zuhören, obwohl die Mikrofone der Hörgeräte auch die Sprache der übrigen Gäste aufnehmen, ein Sprachassistenzsystem soll Befehle und Anfragen möglichst fehlerfrei verstehen, auch wenn im Hintergrund Kinder spielen oder ein Fernseher läuft, und auch bei der Freisprechkommunikation mit einem Mobiltelefon soll mein Gesprächspartner vor allem meine Stimme hören und nicht sein eigenes Echo, welches vom Lautsprecher in das Mikrofon zurückgekoppelt wird.

In all diesen Fällen kann die Signalverarbeitung im Zusammenspiel mit Verfahren des maschinellen Lernens  genutzt werden, um das gewünschte Sprachsignal von den übrigen Sprachsignalen zu trennen. In studentischen Arbeiten werden  entsprechende Verfahren aus der wissenschaftlichen Literatur oder den aktuellen Forschungsarbeiten am Lehrstuhl durch Studierende erarbeitet und  implementiert, um sie dann zu  bewerten und weiterzuentwickeln.

   

Werkzeuge und Methoden

Bearbeitet werden die Aufgaben überwiegend in Matlab / Simulink, wobei auch eine Entwicklung in z.B. Python in einigen Arbeiten sinnvoll sein kann. Methodisch bilden Verfahren der digitalen und statistischen Signalverarbeitung (z.B. schnelle Faltung, Schätzverfahren) die Grundlage. Darüber hinaus können Methoden aus dem Bereich des maschinellen Lernens (z.B. neural networks, deep learning) oder adaptive Filter zum Einsatz kommen.

Beispiele abgeschlossener Arbeiten zur Sprechertrennung

  • Echtzeitsimulation akustischer Echos in der Mobilkommunikation (Praxisprojekt)
  • Untersuchung zu Problemen und Lösungsstrategien in der stereophonen Echokompensation (Bachelorarbeit)
  • Models and Algorithms for Nonlinear Acoustic System Identification (Masterarbeit)
  • ...

Vorläufige Ansprechpartnerin:

Prof. Dr.-Ing. Rainer Martin
ID 2 / 233
0234 / 32 22595
rainer.martin@rub.de