Hochdimensionale Statistik
Lehrstuhl Stochastik » Lehre » Sommersemester 2017

Hochdimensionale Statistik

Sommersemester 2017 - LV-Nr. 150 298

Vorlesung
Dozent Zeit Raum
Prof. H. Dette Montags, 08.30 - 10.00 Uhr NA 3/24
Prof. H. Dette Donnerstags, 08.00 - 10.00 Uhr NA 4/24
Übungen
Dozentin Zeit Raum
Dr. B. Berghaus Mittwochs, 10.00 - 12.00 Uhr NA 5/64

Voraussetzungen

Die Vorlesung richtet sich an Studierende, die mindestens über Vorkenntnisse aus den Vorlesungen Wahrscheinlichkeitstheorie I und Statistik I verfügen.

Kommentar

Seit Anfang des Jahrtausends hat sich in der mathematischen Statistik ein neues Forschungsgebiet entwickelt, welches sich mit der Analyse hochdimensionaler Datenstrukturen beschäftigt. Dabei geht es insbesondere darum, dass die Dimension des Parametervektors in statistischen Modellen größer ist als die Anzahl der Daten in der Stichprobe. Man denke hier zum Beispiel an die Beschreibung der Wahrscheinlichkeit eines Auftretens einer Krankheit in Abhängigkeit eines Teils der DNA
-Sequenz oder an die statistische Analyse von sozialen Netzwerken. Mit klassischen Methoden der mathematischen Statistik können solche Modelle nicht analysiert werden.

In den letzten Jahren sind in der mathematischen Statistik zahlreiche Methoden entwickelt worden, mit denen solche Fragestellungen untersucht werden können. In dieser Vorlesung werden die mathematischen Grundlagen dieser Verfahren besprochen. Insbesondere wollen wir verstehen, wann und warum diese Methoden "richtige" Ergebnisse liefern. Wesentliche Themen der Vorlesung sind: Konzentrationsungleichungen, hochdimensionale lineare Modelle (Lasso), Variablen-Selektion, Sparsity, multiples Testen, Boosting und graphische Modelle.

Die Vorlesung richtet sich an Studierende, die mindestens über Vorkenntnisse aus den Vorlesungen Wahrscheinlichkeitstheorie I und Statistik I verfügen. Kenntnisse aus Statistik II sind ebenfalls hilfreich. Weitere Methoden, die für das Thema notwendig sind, werden in der Vorlesung bereitgestellt. Von den Zuhörern wird außerdem intensive Mitarbeit erwartet.

Auf Wunsch der Teilnehmer an der Veranstaltung kann die Vorlesung auch auf andere Termine verschoben werden.

Literatur

  • P. Bühlmann and S. van de Geer: "Statistics for High-Dimensional Data", Springer
  • B. Efron: "Large-Scale Inference", Cambridge University Press
  • T. Hastie, R. Tibshirani and M. Wainwright: "Statistical Learning with Sparsity", Cambridge University Press