Lehrstuhl Stochastik » Lehre » Wintersemester 22 23

Seminar zu Statistik: Optimal Subsampling

Wintersemester 2022/23 - LV-Nr. 150 515

Das Seminar richtet sich an Studierende, mit guten Kenntnissen aus den Veranstaltungen
Wahrscheinlichkeitstheorie I und Statistik I (oder vergleichbaren Vorlesungen). Vorbesprechung:
Montag, 18. Juli 2022, 17:15 via Zoom (link in moodle oder bei Holger Dette nachfragen)

Beschreibung

Im Big-Data Zeitalter sind viele klassische statistische Verfahren (wie z.B. maximum likelihood Schätzung) nicht mehr anwendbar, da sie wegen der Größe Datensätze zu lange Rechenzeit benötigen, um die entsprechenden Statistiken zu berechnen. Subsampling-Methoden versuchen diese Statistiken aus einer substantiell kleineren Teilstichprobe der Gesamtstichprobe zu stimmen. Dadurch wird direkt die Berechenbarkeit gewährleistet, allerdings kann die Teilstichprobe „gut“ oder „schlecht“ ausgewählt werden. Ein optimales Subsampling bestimmt eine Teilstichprobe so, dass diese möglichst „viel Information“ der Gesamtstichprobe enthält. In dem Seminar werden wir diesen Begriff präzisieren und besprechen verschiedene Vorschläge für optimale optimalen Subsampling-Strategien aus der neueren Literatur.