History

leestott f915efe2b4 🌐 Update translations via Co-op Translator		2 weeks ago
..
1-QLearning	🌐 Update translations via Co-op Translator	2 weeks ago
2-Gym	🌐 Update translations via Co-op Translator	2 weeks ago
README.md	🌐 Update translations via Co-op Translator	3 weeks ago

README.md

Introduzione al reinforcement learning

Il reinforcement learning, RL, è considerato uno dei paradigmi fondamentali del machine learning, accanto al supervised learning e all'unsupervised learning. RL riguarda le decisioni: prendere le decisioni giuste o almeno imparare da esse.

Immagina di avere un ambiente simulato, come il mercato azionario. Cosa succede se imponi una determinata regolamentazione? Ha un effetto positivo o negativo? Se accade qualcosa di negativo, devi prendere questo rinforzo negativo, imparare da esso e cambiare rotta. Se invece l'esito è positivo, devi costruire su quel rinforzo positivo.

Peter e i suoi amici devono scappare dal lupo affamato! Immagine di Jen Looper

Argomento regionale: Pierino e il lupo (Russia)

Pierino e il lupo è una fiaba musicale scritta dal compositore russo Sergei Prokofiev. È la storia del giovane pioniere Pierino, che coraggiosamente esce di casa per andare nella radura della foresta a caccia del lupo. In questa sezione, addestreremo algoritmi di machine learning che aiuteranno Pierino a:

Esplorare l'area circostante e costruire una mappa di navigazione ottimale.
Imparare a usare uno skateboard e a mantenere l'equilibrio, per spostarsi più velocemente.

🎥 Clicca sull'immagine sopra per ascoltare Pierino e il lupo di Prokofiev

Reinforcement learning

Nelle sezioni precedenti, hai visto due esempi di problemi di machine learning:

Supervised, in cui abbiamo dataset che suggeriscono soluzioni campione al problema che vogliamo risolvere. Classificazione e regressione sono compiti di supervised learning.
Unsupervised, in cui non abbiamo dati di addestramento etichettati. L'esempio principale di unsupervised learning è il Clustering.

In questa sezione, ti introdurremo a un nuovo tipo di problema di apprendimento che non richiede dati di addestramento etichettati. Esistono diversi tipi di tali problemi:

Apprendimento semi-supervisionato, in cui abbiamo molti dati non etichettati che possono essere utilizzati per pre-addestrare il modello.
Reinforcement learning, in cui un agente impara come comportarsi eseguendo esperimenti in un ambiente simulato.

Esempio - videogioco

Supponiamo di voler insegnare a un computer a giocare a un videogioco, come gli scacchi o Super Mario. Per far giocare il computer, dobbiamo fargli prevedere quale mossa fare in ciascuno degli stati del gioco. Anche se potrebbe sembrare un problema di classificazione, non lo è - perché non abbiamo un dataset con stati e azioni corrispondenti. Anche se potremmo avere alcuni dati, come partite di scacchi esistenti o registrazioni di giocatori che giocano a Super Mario, è probabile che tali dati non coprano sufficientemente un numero abbastanza grande di stati possibili.

Invece di cercare dati di gioco esistenti, il Reinforcement Learning (RL) si basa sull'idea di far giocare il computer molte volte e osservare il risultato. Pertanto, per applicare il Reinforcement Learning, abbiamo bisogno di due cose:

Un ambiente e un simulatore che ci permettano di giocare molte volte. Questo simulatore definirebbe tutte le regole del gioco, così come gli stati e le azioni possibili.
Una funzione di ricompensa, che ci dica quanto bene abbiamo fatto durante ogni mossa o partita.

La principale differenza tra altri tipi di machine learning e RL è che in RL tipicamente non sappiamo se vinciamo o perdiamo fino a quando non terminiamo la partita. Pertanto, non possiamo dire se una certa mossa da sola sia buona o meno - riceviamo una ricompensa solo alla fine della partita. Il nostro obiettivo è progettare algoritmi che ci permettano di addestrare un modello in condizioni di incertezza. Impareremo un algoritmo di RL chiamato Q-learning.

Lezioni

Crediti

"L'introduzione al Reinforcement Learning" è stata scritta con ♥️ da Dmitry Soshnikov

Disclaimer:
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica Co-op Translator. Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un traduttore umano. Non siamo responsabili per eventuali incomprensioni o interpretazioni errate derivanti dall'uso di questa traduzione.