From c9e4c8c32af854aea6d7e7abde7e1406bea04b67 Mon Sep 17 00:00:00 2001 From: Angel Mendez Date: Wed, 23 Feb 2022 15:27:54 -0600 Subject: [PATCH] Update 8-Reinforcement/1-QLearning/translations/assignment.es.md Fix typo Co-authored-by: Steven Jocol <53009062+Stevengez@users.noreply.github.com> --- 8-Reinforcement/1-QLearning/translations/assignment.es.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/8-Reinforcement/1-QLearning/translations/assignment.es.md b/8-Reinforcement/1-QLearning/translations/assignment.es.md index 5d58a714..62ab9752 100644 --- a/8-Reinforcement/1-QLearning/translations/assignment.es.md +++ b/8-Reinforcement/1-QLearning/translations/assignment.es.md @@ -24,4 +24,4 @@ En tu solución, mantén el código responsable de la estrategia de caminata ale | Criterio | Ejemplar | Adecuado | Necesita mejorar | | -------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------ | -| | Se presentó un notebook con la definición de las nuevas reglas del mundo. El algoritmo Q-Learning y algunas explicaciones textuales. Q-Learning es capa de mejorar significativamente los resultados comparado con la caminata aleatoria. | Se presentó un notebook, Q-Learning se implementó y mejoró los resultados comparado con la caminata aleatoria, pero no de forma significativa; o el notebook está pobremente documentado y el código no está bien estructurado | Se hicieron algunos intentos para redefinir las reglas del mundo, pero el algoritmo de Q-Learning no funciona, o la función reward no está totalmente definida | +| | Se presentó un notebook con la definición de las nuevas reglas del mundo. El algoritmo Q-Learning y algunas explicaciones textuales. Q-Learning es capaz de mejorar significativamente los resultados comparado con la caminata aleatoria. | Se presentó un notebook, Q-Learning se implementó y mejoró los resultados comparado con la caminata aleatoria, pero no de forma significativa; o el notebook está pobremente documentado y el código no está bien estructurado | Se hicieron algunos intentos para redefinir las reglas del mundo, pero el algoritmo de Q-Learning no funciona, o la función reward no está totalmente definida |