Theses
You are interested in writing a thesis in the field of statistical methods?
We offer topics for bachelor, master and PhD theses on current research questions at any time. An overview of currently available topics in the field of statistical methods can be found at the bottom of this page. Below there is also an overview of the theses written so far in our group on this topic.
If you are interested in one of the currently available topics, or if you would like to discuss other possiblities or topics in the field of statistical methods, please feel free to contact us. We are looking forward to a personal conversation with you.
Contact
Currently available topics for theses
IID vs. MCMC – Machine-Learning-gestützte Klassifikation in Monte-Carlo-Simulationen
- Abschlussarbeitsthemen
- Statistische Methoden
Hintergrund:
Die statistische Analyse von Daten ist ein Kernbestandteil vieler Bereiche in der Wissenschaft und stützt sich oft auf Monte-Carlo-Methoden, um komplexe Wahrscheinlichkeitsverteilungen abzubilden oder hochdimensionale Integrale zu lösen. Dabei unterscheiden sich jedoch die theoretisch akkuraten IID-Samples (d.h. unabhängig identisch verteilte Stichproben) grundlegend von Samples die mit Monte-Carlo-Methoden, wie Makov-Chain-Monte-Carlo (MCMC), generiert werden. Dieser Unterschied kann erheblichen Einfluss auf die Qualität von Simulationen und den daraus gewonnenen Erkenntnissen haben.
Ein möglicher Ansatz ist, Maschinelles Lernen zu nutzen, um zwischen IID- und MCMC-Samples zu unterscheiden. Indem man ein Neuronales Netz darauf trainiert, Muster in den generierten Stichproben zu erkennen, soll sich ein Kriterium entwickeln lassen, das zuverlässig angibt, wie nah eine gegebene Stichprobe an einem IID-Sample liegt. Diese “IID-Likeness” kann so künftig als Benchmark für MCMC-Sampler genutzt werden, um dessen Güte und Effizienz zu bestimmen.
Ziel der Arbeit:
Ziel dieser Bachelorarbeit ist es, ein Machine-Learning-basiertes Verfahren zu konzipieren und implementieren, das zwischen IID- und MCMC-Samples unterscheidet. Auf dieser Grundlage soll ein Gütekriterium bestimmt werden, welches die Ähnlichkeit zu IID-Samples abbildet. Dazu sollen verschiedene NN-Architekturen und Klassifikationsansätze erprobt und anschließend mit Hilfe von bestehenden Monte-Carlo-Infrastrukturen (z.B. BAT.jl) getestet werden. Die Ergebnisse sollen in Form von Benchmarks für verschiedene Testfunktionen und Monte-Carlo Methoden dokumentiert werden, um eine aussagekräftige Vergleichsmöglichkeit zwischen unterschiedlichen Samplern und Konfigurationen zu schaffen.
Wünschenswerte Voraussetzungen:
- Interesse an statistischen Methoden und Monte-Carlo-Techniken
- Grundkenntnisse in Maschinellem Lernen
- Grundkenntnisse in Programmierung (vorzugsweise Julia oder Python)
Completed Theses
Dissertationen
Robin Pelkner | Development and application of a serialization standard for statistical models in high energy physics | November 2023 |
Master Theses
Robin Pelkner | Rediscovering the Higgs - Bringing a new standard for advanced statistical models to Julia | December 2023 |
Bachelor Theses
Benjamin Schäfer | Implementation, tuning and performance tests of an ECMC sampler in BAT.jl | August 2023 |
Moritz Terwissen | Performing high energy physics data analyses using Julia and BAT.jl | Juli 2022 |
Willy Weber | Nested sampling algorithm in BAT.jl | August 2021 |
Robin Pelkner | Testing the performance of sampling algorithms in BAT.jl | Dezember 2020 |
Dominik Wittmann | Parameteranalyse des Multi-Channel Markov Chain Monte Carlo Sampling-Algorithmus | Dezember 2016 |
Cornelius Grunwald | Influence of correlated background sources on the objective Bayesian analysis of counting experiments | Juli 2015 |
Florian Mentzel | Objective Bayesian analysis of counting experiments in high energy physics | Juli 2015 |