Ausgewählte Arbeiten

Elf Projekte, ordentlich aufgeschrieben.

Jedes ist eine Case Study, kein Screenshot. Suchen Sie sich eines aus.

01

2026 · Force24 · Analytics Engineer, Datenebene

Account Intelligence Platform

Force24 Account Intelligence Platform Thumbnail mit Architektur-Schichten

Eine Greenfield-Plattform für Account Intelligence, in 16 Wochen bei Force24 für CSMs, Accounts und Stakeholder gebaut, gemeinsam mit dem Engineering-Team in eine Live-Produktionsumgebung ausgeliefert. Ich habe die Datenebene end-to-end verantwortet, sie über Endpoint-Änderungen und Redis-Caching in den FastAPI-Service integriert, und Features und Erweiterungen im Angular-Frontend ausgeliefert. Gebaut nach dem Prinzip, dass Dashboards Handeln auslösen sollen, nicht nur Daten anzeigen. Vertrauliches Projekt, sanitisierte Case Study.

DagsterdbtPostgreSQL PythonRedisAngular

Case Study lesen →

02

2026 · Forschung · Produktions-ML · Agentic AI

Agentic ELT Data Platform for Customer Intelligence

Agentic ELT Data Platform Thumbnail mit geschichtetem Datenfluss und MCP-Knoten

MSc-Dissertation in einer Live-B2B-SaaS-Umgebung unter NDA. End-to-end JSONB-first ELT-Plattform und Drei-Modell-Churn-Intelligence-Stack (Survival, XGBoost via PostgresML und DR-Learner Causal Inference), zugänglich über FastAPI, Angular und einen MCP-Endpoint für agentischen LLM-Zugriff. Über 1 Million Datensätze aus mehreren Vendor-APIs ingestiert, 48 dbt-Modelle.

PythonPostgreSQLdbt DagsterPostgresMLXGBoostMCP

Case Study lesen →

03

2026 · Side Project · Healthcare ML

Pharmazeutische Nebenwirkungs-Klassifikation

Thumbnail Pharmazeutische Nebenwirkungs-Klassifikation mit gestapelten Klassifikationsbalken

Produktionsreifes Python-Paket, das Freitext-Beschreibungen von Nebenwirkungen in eine MedDRA-orientierte Taxonomie aus zehn klinischen Kategorien klassifiziert, über 11.825 marktverfügbare Medikamente. Eine einzige sklearn-Pipeline mit ColumnTransformer für TF-IDF-Textfeatures und Ordinal-Encoding der Hersteller, end-to-end joblib-serialisiert. Pydantic-Config, CLI-Entrypoints, pytest-Fixtures, GitHub-Actions-CI-Matrix auf Python 3.10, 3.11, 3.12.

Pythonscikit-learnpandas pytestGitHub Actions

Case Study lesen →   Auf GitHub ansehen →

04

2023 · MSc Thesis · Sportanalytik

Big Data Analytics für Spieler-Recruitment

Big Data Player Scouting Thumbnail mit Fußballfeld-Umriss

Ranking und Empfehlungen für Fußball-Talente quer durch fünf europäische Top-Ligen, mit Event-Daten und PlayeRank-Metriken. Hypothesengetriebene Forschungsarbeit, die untersucht, wie Data Analytics Coaches und Scouts beim Recruitment unterstützen kann. Veröffentlichte Thesis, öffentlicher Code.

PythonPySparkJupyter PlayeRankUEFA event data

Case Study lesen →   Auf GitHub ansehen →

05

2026 · Side Project · NLP und Medienanalyse

Conflict Sentiment Analysis

Thumbnail Conflict Sentiment Analysis mit Sentiment-Polaritätswelle

Eine vergleichende Methodikstudie, die quantifiziert, wie 8.158 englischsprachige Nachrichtenartikel den Russland-Ukraine-Konflikt über 68 Publisher und 18 Länder hinweg gerahmt haben. Drei Sentiment-Engines (TextBlob, VADER, CardiffNLP RoBERTa) und ein fünf-Topic-LDA über demselben Korpus, hinter einer abstrakten SentimentEngine-Basisklasse mit Registry-Pattern. Transformer in der CI gemockt, damit Tests keine Gigabytes an Weights herunterladen.

PythonHuggingFacePyTorch NLTKgensim LDAGitHub Actions

Case Study lesen →   Auf GitHub ansehen →

06

2024 · Side Project · Gaming-Sektor

Collaborative Filtering Recommender at Scale

Steam Games Recommender Thumbnail mit Drei-Knoten-Graph

PySpark + ALS Recommender auf dem Steam-200k-Implicit-Feedback-Dataset. Distributed Training, Hyperparameter-Tuning per Grid Search mit CrossValidator, vollständiges Experiment Tracking und Model Logging in MLflow. Auf Databricks Community Edition gebaut und getestet.

PySparkSpark MLlibALS MLflowDatabricksPython

Case Study lesen →   Auf GitHub ansehen →

07

2026 · Side Project · Finance, Time Series

Equity Forecasting

Thumbnail Equity Forecasting mit Zeitreihenlinie und Forecast-Konus

Reproduzierbares R-Analysepaket für die tägliche Schlusskurs-Prognose von Aktien. ARIMA, ETS und eine naive Baseline hinter einem MODEL_REGISTRY-Pattern. Kombiniertes ADF-plus-KPSS-Stationaritätsverdikt, Residuen-Diagnostik (Ljung-Box, Shapiro-Wilk), Forecast-Evaluation gegen die naive Baseline. 5.124 Tagesbeobachtungen von NYSE-Ticker A von 1999 bis 2023. testthat-Suite, lintr-Config, R-CMD-check-CI-Matrix über mehrere R-Versionen.

Rforecasttseries testthatlintrGitHub Actions

Case Study lesen →   Auf GitHub ansehen →

08

2024 · Side Project · Healthcare-Sektor

Clinical Trial Data Analysis

Clinical Trial Data Analysis Thumbnail mit ansteigendem Balkendiagramm

Statistische Analyse und Visualisierung klinischer Studiendaten in Python. Methodischer Durchlauf: Datensatz laden und profilieren, fehlende Werte nach dokumentierten Regeln behandeln, Hypothesentests passend zur Datenform wählen, jeden p-Wert mit einer Effektgröße kombinieren.

PythonpandasNumPy MatplotlibStatistik

Case Study lesen →   Auf GitHub ansehen →

09

2024 · Side Project · Aviation-Sektor

Relationales DB-Design für Airport-Ticketing

AirWave Express Ticketing System Thumbnail mit Flugbahn und Flugzeug

SQL-Server-Schema für Passenger-Management, Flugplanung, Reservierungen, Ticketing, Gepäck und ergänzende Services. Auto-Increment-IDs über Sequences und Triggers, referentielle Integrität über CHECK-, NOT-NULL- und UNIQUE-Constraints. Production-Grade-Schema-Design mit detailliertem Projektbericht.

SQL ServerT-SQLSchema Design TriggersSequences

Case Study lesen →   Auf GitHub ansehen →

10

2025 · Side Project · Engineering, Statistik

Building Energy Loads

Thumbnail Building Energy Loads mit überlappenden Gebäudeansichten

R-Analysepaket, das Heiz- und Kühllasten aus acht Gebäudegeometrie-Parametern über 768 simulierte Konfigurationen vorhersagt. Schrittweise lineare Regression auf jede Zielgröße, mit VIF-Kollinearitäts-Checks (car), Shapiro-Wilk-Normalität, Breusch-Pagan-Heteroskedastizität und den Standard-Residuen-Diagnostik-Plots. testthat-Suite mit synthetischer Fixture, R-CMD-check-CI.

Rstats::stepcar (VIF) testthatlintrGitHub Actions

Case Study lesen →   Auf GitHub ansehen →

11

2025 · Side Project · BI-Showcase, Makroökonomie

Economic Resilience Dashboard

Thumbnail Economic Resilience Dashboard mit absteigenden Wirtschaftsindikator-Balken

Single-Screen-Power-BI-Report über 20 Jahre IMF-World-Economic-Outlook-Daten zu 26 einkommensstarken Volkswirtschaften (2001 bis 2020). Star-Schema-Modell, acht Indikatoren speisen neun DAX-Measures, ein Metric-Selector-Field-Parameter, plus ein Python-Begleit-Validator (pandas + openpyxl + pytest), der bei jedem Push jeden Datensatz-Deskriptor im README gegen den tatsächlichen xlsx-Inhalt prüft.

Power BIDAXPower Query Python-ValidatorpytestGitHub Actions

Case Study lesen →   Auf GitHub ansehen →