Lernverfahren


Reinforcement Learning (bestärkendes Lernen): Während der Trainingsphase wird dem Netz mitgeteilt, ob das Ergebnis false oder true ist. Die korrekte Ausgabe wird dann vom Netz selbst gefunden.

Supervised Learning (überwachtes Lernen): Die tatsächliche Reaktion wird mit einem gewünschten Ergebnis verglichen.

Beim überwachten Lernen aus Beispielen, von dem im folgenden ausgegangen wird, unterscheidet man zwei meist unabhängig voneinander durchgefiihrte Phasen, die Lernphase (Trainingsphase) und die Kannphase (Testphase). In der Lernphase wird mit Hilfe der geeignet repräsentierten und codierten Beispiele eine Approximation ƒ der gewünschten Funktion ƒ berechnet. Die Funktion ƒ ist dabei eine idealisierte Funktion, die jeder möglichen Eingabe die bestmögliche Ausgabe zuweist. In dieser Phase findet das eigentliche Lernen statt, das darin besteht, ƒ möglichst nahe an ƒ zu approximieren. In der Kannphase wird nun eine (eventuell neue) Eingabe präsentiert und die entsprechende Ausgabe durch die approximierte Funktion ƒ berechnet. Diese Ausgabe muss dann zur anschließenden Interpretation oder Weiterverarbeitung wieder dekodiert werden. Anhand der Ergebnisse kann man dann beurteilen, wie gut die Funktion ƒ gelernt, also approximiert worden ist.

Unsupervised Learning (nicht überwachtes Lernen): Das Netz findet selbst seine Gewichte.