Kategorie
Themen
Data Science Tutorials
Bringe deine Datenkarriere mit unseren Data Science-Tutorials voran. Wir führen dich Schritt für Schritt durch anspruchsvolle Data Science-Funktionen und -Modelle.
Weitere Themen:
Training für 2 oder mehr Personen?Probiere es mit DataCamp for Business
FIFA World Cup 2026: Siegerprognose mit MLOps – der Leitfaden
Erfahre, wie eine End-to-End-MLOps-Pipeline die WM 2026 prognostiziert – vom automatischen Retraining und DVC bis zur 10.000-laufenden Monte-Carlo-Simulation des Turnierbaums.
Tom Farnschläder
17. Juni 2026
Kerndichteschätzung: Von der Theorie zur Praxis
Die Kerndichteschätzung ist eine nichtparametrische Methode, um die Form einer Datenverteilung ohne festes Modell zu schätzen. Lerne die Formel, die Bandbreitenwahl und die praktische Umsetzung in Python und R kennen.
Dario Radečić
16. Juni 2026
Spline-Regression: Ein praxisnaher Guide mit Python & R
Ein Praxisleitfaden zur Spline-Regression: Wie stückweise Polynome und Knoten nichtlineare Zusammenhänge modellieren, die wichtigsten Spline-Typen und das Fitting in Python und R.
Dario Radečić
15. Juni 2026
Annahmen der logistischen Regression: Das solltest du vor dem Modellieren prüfen
Ein praxisnaher Leitfaden zu den Annahmen hinter der logistischen Regression, den Diagnosen für Verstöße in Python und R und den Alternativen, wenn die Annahmen nicht halten.
Dario Radečić
15. Juni 2026
Overfitting vs. Underfitting: Ein praxisnaher Leitfaden zur Modelldiagnostik
Ein detaillierter Überblick über Overfitting und Underfitting im Machine Learning – inklusive Erkennung, Ursachen und Lösungen über den Bias-Variance-Trade-off.
Dario Radečić
12. Juni 2026
Generalisierte lineare Modelle (GLM): Ein Einstieg in Theorie und Code
Ein praxisnaher Leitfaden zu GLMs – was sie sind, wie ihre drei Komponenten zusammenspielen und wie du sie in Python und R fitst und interpretierst.
Dario Radečić
12. Juni 2026
Gradient Clipping: So verhinderst du explodierende Gradienten
Gradient Clipping ist ein Ein-Zeilen-Fix im Training, der verhindert, dass explodierende Gradienten tiefe neuronale Netze ruinieren. Diese Anleitung erklärt das Prinzip, die zwei gängigen Methoden, die Wahl des Schwellwerts und die Umsetzung in PyTorch und TensorFlow.
Dario Radečić
10. Juni 2026
Markov-Chain-Monte-Carlo (MCMC): Komplexe Wahrscheinlichkeitsverteilungen sampeln
Ein Leitfaden zu Markov-Chain-Monte-Carlo – wie es funktioniert, warum es genutzt wird, die gängigsten Algorithmen und wie du es in Python für bayes’sche Inferenz anwendest.
Dario Radečić
10. Juni 2026
Support Vector Regression (SVR): So funktioniert sie – und wann du sie einsetzt
Support Vector Regression ist eine randbasierte Regressionsmethode, die kleine Fehler bewusst ignoriert, Nichtlinearitäten per Kernel abbildet und auf verrauschten Realweltdaten überzeugt, wo Standardregression an Grenzen stößt.
Dario Radečić
4. Juni 2026
Normalitätstest: So prüfst du, ob deine Daten normalverteilt sind
Erfahre, was ein Normalitätstest ist, warum er wichtig ist und wie du gängige Tests wie Shapiro-Wilk, Kolmogorov-Smirnov und visuelle Methoden anwendest – inklusive Beispielen in Python und R.
Dario Radečić
4. Mai 2026
Kruskal-Wallis-Test: Mehrere Gruppen ohne Normalverteilung vergleichen
Ein praktischer Leitfaden zum Kruskal-Wallis-Test – was er ist, wie er funktioniert, wann er ANOVA ersetzt und wie du ihn in Python und R durchführst und interpretierst.
Dario Radečić
4. Mai 2026
Der Kernel-Trick erklärt: Wie SVMs nichtlineare Muster lernen
Ein konzeptioneller Leitfaden zum Kernel-Trick – was er ist, wie er SVMs und andere Kernel-Modelle ermöglicht und wann du ihn nichtlinearen Alternativen vorziehen solltest.
Dario Radečić
4. Mai 2026