History

Pikachú 9fc2b847b8 updated image translation for the various languages		7 months ago
..
1-QLearning	updated image translation for the various languages	7 months ago
2-Gym	updated image translation for the various languages	7 months ago
README.md	updated image translation for the various languages	7 months ago

README.md

Einführung in das Reinforcement Learning

Reinforcement Learning (RL) wird als eines der grundlegenden Paradigmen des maschinellen Lernens angesehen, neben dem überwachten und unüberwachten Lernen. RL dreht sich um Entscheidungen: die richtigen Entscheidungen zu treffen oder zumindest aus ihnen zu lernen.

Stellen Sie sich vor, Sie haben eine simulierte Umgebung wie den Aktienmarkt. Was passiert, wenn Sie eine bestimmte Regelung auferlegen? Hat sie einen positiven oder negativen Effekt? Wenn etwas Negatives passiert, müssen Sie diese negative Verstärkung annehmen, daraus lernen und den Kurs ändern. Wenn das Ergebnis positiv ist, sollten Sie auf dieser positiven Verstärkung aufbauen.

Peter und seine Freunde müssen dem hungrigen Wolf entkommen! Bild von Jen Looper

Regionales Thema: Peter und der Wolf (Russland)

Peter und der Wolf ist ein musikalisches Märchen, das von dem russischen Komponisten Sergei Prokofiev geschrieben wurde. Es ist die Geschichte des jungen Pioniers Peter, der mutig aus seinem Haus auf die Lichtung im Wald geht, um den Wolf zu jagen. In diesem Abschnitt werden wir Algorithmen des maschinellen Lernens trainieren, die Peter helfen werden:

Die Umgebung zu erkunden und eine optimale Navigationskarte zu erstellen.
Zu lernen, wie man ein Skateboard benutzt und darauf balanciert, um schneller voranzukommen.

🎥 Klicken Sie auf das Bild oben, um Peter und den Wolf von Prokofiev zu hören.

Reinforcement Learning

In den vorherigen Abschnitten haben Sie zwei Beispiele für Probleme des maschinellen Lernens gesehen:

Überwachtes Lernen, bei dem wir Datensätze haben, die Beispiel-Lösungen für das Problem vorschlagen, das wir lösen möchten. Klassifikation und Regression sind Aufgaben des überwachten Lernens.
Unüberwachtes Lernen, bei dem wir keine beschrifteten Trainingsdaten haben. Das Hauptbeispiel für unüberwachtes Lernen ist Clustering.

In diesem Abschnitt werden wir Ihnen eine neue Art von Lernproblem vorstellen, das keine beschrifteten Trainingsdaten benötigt. Es gibt mehrere Arten solcher Probleme:

Semi-überwachtes Lernen, bei dem wir eine große Menge an unbeschrifteten Daten haben, die verwendet werden können, um das Modell vorzutrainieren.
Reinforcement Learning, bei dem ein Agent lernt, wie er sich verhalten soll, indem er Experimente in einer simulierten Umgebung durchführt.

Beispiel - Computerspiel

Angenommen, Sie möchten einem Computer beibringen, ein Spiel zu spielen, wie Schach oder Super Mario. Damit der Computer ein Spiel spielen kann, muss er vorhersagen, welchen Zug er in jedem der Spielzustände machen soll. Auch wenn dies wie ein Klassifikationsproblem erscheinen mag, ist es das nicht - weil wir keinen Datensatz mit Zuständen und entsprechenden Aktionen haben. Auch wenn wir einige Daten wie bestehende Schachpartien oder Aufzeichnungen von Spielern, die Super Mario spielen, haben, ist es wahrscheinlich, dass diese Daten nicht ausreichend eine große Anzahl möglicher Zustände abdecken.

Anstatt nach vorhandenen Spieldaten zu suchen, basiert Reinforcement Learning (RL) auf der Idee, den Computer viele Male spielen zu lassen und das Ergebnis zu beobachten. Um Reinforcement Learning anzuwenden, benötigen wir daher zwei Dinge:

Eine Umgebung und einen Simulator, die es uns ermöglichen, ein Spiel viele Male zu spielen. Dieser Simulator würde alle Spielregeln sowie mögliche Zustände und Aktionen definieren.
Eine Belohnungsfunktion, die uns sagt, wie gut wir während jedes Zuges oder Spiels abgeschnitten haben.

Der Hauptunterschied zwischen anderen Arten des maschinellen Lernens und RL besteht darin, dass wir im RL typischerweise nicht wissen, ob wir gewinnen oder verlieren, bis wir das Spiel beendet haben. Daher können wir nicht sagen, ob ein bestimmter Zug allein gut oder schlecht ist - wir erhalten erst am Ende des Spiels eine Belohnung. Unser Ziel ist es, Algorithmen zu entwerfen, die es uns ermöglichen, ein Modell unter unsicheren Bedingungen zu trainieren. Wir werden über einen RL-Algorithmus namens Q-Learning lernen.

Lektionen

Danksagungen

"Einführung in Reinforcement Learning" wurde mit ♥️ von Dmitry Soshnikov geschrieben.

Haftungsausschluss:
Dieses Dokument wurde mit maschinellen KI-Übersetzungsdiensten übersetzt. Obwohl wir uns um Genauigkeit bemühen, sollten Sie sich bewusst sein, dass automatisierte Übersetzungen Fehler oder Ungenauigkeiten enthalten können. Das Originaldokument in seiner ursprünglichen Sprache sollte als die maßgebliche Quelle betrachtet werden. Für wichtige Informationen wird eine professionelle menschliche Übersetzung empfohlen. Wir übernehmen keine Haftung für Missverständnisse oder Fehlinterpretationen, die aus der Nutzung dieser Übersetzung entstehen.