Statistik für hochdimensionale Daten

Sommersemester 2015 - LV-Nr. 150 281

Vorlesung
Dozent	Zeit	Raum
Prof. H. Dette	Mittwochs, 12.00 - 14.00 Uhr	NA 2/64
Prof. H. Dette	Freitags, 12.00 - 14.00 Uhr	NA 2/64

Voraussetzungen

Die Vorlesung richtet sich an Studierende, die mindestens über Vorkenntnisse aus den Vorlesungen Wahrscheinlichkeitstheorie I und Statistik I verfügen. Weitere Methoden, die für das Thema notwendig sind, werden in der Vorlesung bereitgestellt. Von den Zuhörern wird außerdem intensive Mitarbeit erwartet.

Kommentar

Seit Anfang des Jahrtausends hat sich in der mathematischen Statistik ein neues Forschungsgebiet entwickelt, welches sich mit der Analyse hochdimensionaler Datenstrukturen beschäftigt. Dabei geht es insbesondere darum, dass die Dimension des Parametervektors in statistischen Modellen größer ist als die Anzahl der Daten in der Stichprobe. Man denke hier zum Beispiel an die Beschreibung der Wahrscheinlichkeit eines Auftretens einer Krankheit in Abhängigkeit eines Teils der DNA-Sequenz oder an die statistische Analyse von sozialen Netzwerken. Mit klassischen Methoden der mathematischen Statistik können solche Modelle nicht analysiert werden.

In den letzten Jahren sind in der mathematischen Statistik zahlreiche Methoden entwickelt worden, mit denen solche Fragestellungen untersucht werden können. In dieser Vorlesung werden die mathematischen Grundlagen dieser Verfahren besprochen. Insbesondere wollen wir verstehen, wann und warum diese Methoden "richtige" Ergebnisse liefern. Wesentliche Themen der Vorlesung sind: Konzentrationsungleichungen, hochdimensionale lineare Modelle (Lasso), Variablen-Selektion, Sparsity, multiples Testen, Boosting und graphische Modelle.

Literatur

P. Bühlmann, S. van de Geer, "Statistics for High-Dimensional Data", Springer
B. Efron, "Large-Scale Inference", Cambridge University Press

Lehrstuhl für Stochastik