Gollnick Data Solutions LogoGollnick Data
Zurück zur Übersicht

Overfitting & Underfitting

Verschiebe den Regler für den Polynomgrad und sieh, wie sich Trainingsfehler und Testfehler unterschiedlich entwickeln – der Bias-Varianz-Tradeoff live.

-1-0.500.51-2-1012
Wahre FunktionGrad nTrainingTest
⚡ Underfitting – Modell zu simpel
0.2973Train MSE
1.1053Test MSE
n = 3
1612

Wahre Funktion: y = sin(2πx). 15 Trainingspunkte, 12 Testpunkte, Rauschen σ = 0.3.

Fehler vs. Modellkomplexität

0.00.51.01.52.0123456789101112PolynomgradMSE
Train MSETest MSEKlicke auf einen Punkt → Grad wählen

Konzepte

B

Underfitting (Hoher Bias)

Ein zu einfaches Modell (z. B. Gerade durch eine Sinuskurve) kann die Struktur der Daten nicht erfassen. Sowohl Trainings- als auch Testfehler sind hoch – das Modell hat hohen Bias. Man sagt: es ist zu wenig flexibel.

V

Overfitting (Hohe Varianz)

Ein zu komplexes Modell 'memoriert' die Trainingsdaten inklusive ihres Rauschens. Der Trainingsfehler sinkt stark, der Testfehler steigt. Das Modell hat hohe Varianz – es generalisiert nicht auf neue Daten.

B↔V

Bias-Varianz-Tradeoff

Der Fehler eines Modells setzt sich aus Bias² + Varianz + Rauschen zusammen. Mehr Modellkomplexität senkt den Bias, erhöht aber die Varianz. Das optimale Modell minimiert ihre Summe – genau der Knick im Testfehlerkurve.

G

Generalisierung

Das eigentliche Ziel des maschinellen Lernens ist nicht, die Trainingsdaten perfekt zu fitten, sondern auf ungesehenen Daten gut zu performen. Testfehler ist die ehrliche Messung. Techniken wie Regularisierung, Dropout und Cross-Validation helfen, den Sweet Spot zu finden.