Was ist Kriging?

Diese Anwendung bietet eine intuitive Einführung in die Welt der Surrogatmodellierung. Wir werden untersuchen, wie Kriging zur Approximation komplexer "Black-Box"-Funktionen eingesetzt wird, um aufwändige Simulationen und Experimente zu ersetzen.

Die Herausforderung: Die "Black Box"

In Wissenschaft und Technik stoßen wir oft auf Systeme, deren Verhalten wir vorhersagen wollen, deren innere Funktionsweise aber zu komplex, zu langsam oder unbekannt ist. Denken Sie an aufwändige Klimasimulationen oder Crash-Tests. Jede einzelne Berechnung kann Tage dauern. Tausende davon durchzuführen, um das System zu verstehen oder zu optimieren, ist undurchführbar. Diese Systeme sind "Black Boxes".

?

Input → [BLACK BOX] → Output

Teuer, langsam, unbekannt

💡

Input → [KRIGING MODELL] → Vorhersage & Unsicherheit

Schnell, datenbasiert, aufschlussreich

Die Lösung: Kriging als Surrogatmodell

Hier kommt das Kriging (auch Gauß-Prozess-Regression) ins Spiel. Es ist ein Surrogatmodell – ein "Modell eines Modells". Anstatt die teure Black Box unzählige Male abzufragen, trainieren wir ein Kriging-Modell mit nur wenigen, gezielt ausgewählten Datenpunkten. Dieses Modell gibt uns nicht nur blitzschnelle Vorhersagen für neue Eingaben, sondern – und das ist seine Superkraft – es quantifiziert auch die Unsicherheit seiner eigenen Vorhersage. Es sagt uns, wo es sich sicher ist und wo es mehr Daten bräuchte.

Die Kernkonzepte

In diesem Abschnitt tauchen wir in das Herzstück des Kriging ein: die Korrelationsfunktion. Sie ist der Schlüssel zum Verständnis, wie das Modell Beziehungen zwischen Datenpunkten "lernt" und Vorhersagen trifft. Interagieren Sie mit den Reglern, um ein Gefühl dafür zu bekommen, wie die Hyperparameter das Verhalten des Modells formen.

Der Korrelationskernel: Das Herz des Modells

Der Kernel definiert, wie die Ähnlichkeit (Korrelation) zwischen zwei Punkten mit zunehmendem Abstand abnimmt. Die gebräuchlichste Form ist der Gauß'sche Kernel. Seine Form wird durch zwei Hyperparameter gesteuert.

Steuert, wie schnell die Korrelation abfällt. Ein hohes bedeutet, dass die Funktion sehr "aktiv" ist und sich schnell ändert. Das Modell lernt dies automatisch aus den Daten.

Steuert die Glattheit der Funktion. =2 (Standard) führt zu einer unendlich glatten Interpolation. Kleinere Werte führen zu "spitzeren" Funktionen.

Die Mathematik dahinter

Für diejenigen, die tiefer eintauchen möchten, bietet dieser Abschnitt einen Blick auf die Formeln, die die Vorhersage ermöglichen. Die Inhalte sind in ausklappbaren Akkordeons untergebracht, damit Sie die Komplexität in Ihrem eigenen Tempo erkunden können.

Die Vorhersage an einem neuen Punkt $x$ ist der "Best Linear Unbiased Predictor" (BLUP). Sie startet beim geschätzten globalen Mittelwert und korrigiert diesen basierend auf den beobachteten Daten .

Der Korrekturterm gewichtet die Abweichungen der Trainingsdaten vom Mittelwert. Die Gewichte hängen von den Korrelationen des neuen Punktes zu den Trainingspunkten () und den Korrelationen der Trainingspunkte untereinander () ab.

(Psi): Eine $n \times n$ Matrix, die die Korrelationen aller $n$ Trainingspunkte untereinander enthält. Sie beschreibt die "innere Struktur" der bekannten Daten.

(psi): Ein $n \times 1$ Vektor (oder eine $n \times m$ Matrix für $m$ Vorhersagepunkte), der die Korrelationen zwischen einem neuen Punkt und allen Trainingspunkten enthält.

Die direkte Berechnung von ist numerisch instabil. In der Praxis wird das Gleichungssystem stattdessen mit robusteren Methoden wie der Cholesky-Zerlegung gelöst. Ein kleiner "Nugget"-Term wird oft zur Diagonale von addiert, um die numerische Stabilität weiter zu verbessern.

Interaktives Beispiel: Sinus-Funktion

Dies ist der Kern der Anwendung. Hier können Sie selbst zum Forscher werden. Spielen Sie mit den Parametern und beobachten Sie, wie das Kriging-Modell lernt, die Sinus-Funktion zu approximieren. Achten Sie darauf, wie sich die Vorhersage (orange Linie) und das Unsicherheitsband (grauer Bereich) verändern.

Erhöhen Sie die Anzahl der Messpunkte. Mehr Punkte reduzieren die Unsicherheit (grauer Bereich).

Passen Sie den Hyperparameter an. Ein "falscher" Wert führt zu einer schlechten Anpassung. In der Praxis wird durch Optimierung (MLE) gefunden.

Der Ausblick: Was kommt als Nächstes?

Kriging ist ein mächtiges Werkzeug und die Grundlage für viele fortgeschrittene Techniken im computergestützten Engineering. Dieser Abschnitt gibt einen kurzen Überblick über einige dieser spannenden Weiterentwicklungen.

Sequentielle Versuchsplanung

Anstatt alle Datenpunkte auf einmal zu wählen, kann das Modell aktiv nach dem informativsten nächsten Punkt suchen. Kriterien wie die "Expected Improvement" (EI) balancieren die Suche nach dem Optimum (Ausnutzen) und die Reduzierung der Unsicherheit (Erkunden).

Gradient-Enhanced Kriging

Wenn neben den Funktionswerten auch deren Ableitungen (Gradienten) aus der Simulation verfügbar sind, können diese in das Modell integriert werden, um die Genauigkeit mit sehr wenigen Datenpunkten drastisch zu erhöhen.

Co-Kriging

Diese Technik fusioniert Daten aus verschiedenen Quellen – z.B. eine schnelle, ungenaue Simulation und eine langsame, hochpräzise. Das Ergebnis ist ein hochgenaues Modell bei deutlich reduziertem Gesamtaufwand.