Ich mache Daten vertrauenswürdig. Dann prädiktiv.
Engineering data. Modelling outcomes.
Data Scientist und Analytics Engineer. Mit Wohnsitz in Manchester, UK. Offen für Stellen in Deutschland, EMEA, UK und Remote. MSc Data Science an der University of Salford, Abschluss Mai 2026.
Quellen → Ingestion → Transformation → Serving → Consumption
Drei Disziplinen, ein Werkzeugkasten.
Angewandtes Machine Learning.
Ich baue Prediction Models und Recommender Systems auf einer sauberen Datenebene. XGBoost für die Modellierung, SHAP für Explainability, MLflow für Tracking, PySpark für Skalierung. Football Scouting (MSc Thesis), Steam Game Recommendations, Churn- und Growth-Prototypen auf Customer-Intelligence-Daten. Keine Black Boxes.
Data Engineering.
Ich baue die Orchestration- und Ingestion-Schicht. Dagster und Airflow für Orchestration, Python für Extractors und Transformations, PostgreSQL/BigQuery/Snowflake als Warehouse. Schedules, Contracts, Observability. Das unscheinbare Rückgrat, von dem alles andere abhängt.
Analytics Engineering.
Ich modelliere Business-Logik in kuratierten Tabellen, die Analysten und nachgelagerte Anwendungen wirklich nutzen. dbt für Transformations, Kimball als Modellierungsmuster, versionskontrolliert und getestet. Raw zu Staging zu Intermediate zu Marts.
Elf Projekte, die mehr über meine Arbeit sagen als mein Lebenslauf.
Account Intelligence Platform
Eine Greenfield-Plattform für Account Intelligence, in 16 Wochen bei Force24 für CSMs, Accounts und Stakeholder gebaut, gemeinsam mit dem Engineering-Team in Produktion ausgeliefert. Ich habe die Datenebene end-to-end verantwortet, über Endpoint-Änderungen und Redis-Caching in den FastAPI-Service integriert und im Angular-Frontend mitgearbeitet. Vertrauliches Projekt, sanitisierte Case Study.
Agentic ELT Data Platform for Customer Intelligence
MSc-Dissertation in einer Live-B2B-SaaS-Umgebung unter NDA. End-to-end JSONB-first ELT-Plattform und Drei-Modell-Churn-Intelligence-Stack (Survival, XGBoost via PostgresML und DR-Learner Causal Inference), zugänglich über FastAPI, Angular und einen MCP-Endpoint für agentischen LLM-Zugriff. Über 1 Million Datensätze aus mehreren Vendor-APIs ingestiert, 48 dbt-Modelle.
Pharmazeutische Nebenwirkungs-Klassifikation
Produktionsreifes Python-Paket, das Freitext-Beschreibungen von Nebenwirkungen in eine MedDRA-orientierte Taxonomie aus zehn klinischen Kategorien klassifiziert, über 11.825 marktverfügbare Medikamente. sklearn-Pipeline mit ColumnTransformer, end-to-end joblib-serialisiert, pytest-Fixtures, GitHub-Actions-CI-Matrix auf Python 3.10, 3.11, 3.12.
Notizen aus der Arbeit.
Artikel und Beiträge, sobald sie erscheinen. Die aktuellsten Beiträge finden Sie auf LinkedIn.
Zusammenfassung.
Sieben Jahre in Daten, quer durch Retail Banking in Edo, Nigeria, Mortgage Analytics in Abuja, Nigeria, Healthcare Marketing in Istanbul, Türkei, und jetzt eine MSc-Abschlussarbeit in Manchester, UK. Der rote Faden bleibt gleich: erst die Datenebene bauen. Dann das Dashboard ausliefern.
Zwei Master (Salford, laufend; Bahcesehir University in der Türkei, GPA 3,67) und ein Engineering-Bachelor an der University of Benin in Nigeria. Neun Zertifizierungen über Google Cloud, IBM und LinkedIn Learning. Zwei Jahre und neun Monate als Microsoft Learn Student Ambassador.
Was mich 2026 beschäftigt: dbt, dimensionale Modellierung, CI/CD für Daten, Analysten schneller machen, und ML-Systeme bauen, die sich selbst erklären.
Lassen Sie uns reden.
Wenn Sie für eine Stelle als Analytics Engineer oder Data Scientist in Deutschland, EMEA, UK oder Remote rekrutieren, freue ich mich über eine Nachricht. Wenn Sie selbst im Feld arbeiten und Notizen zum Modern Data Stack tauschen wollen, gilt das Gleiche.