Actions valides dans l'Openai Gym
-
02-11-2019 - |
Question
Pourquoi les environnements de gym ne sont-ils pas livrés avec des "actions valides"? L'environnement de gymnase normal accepte comme entrée toute action, même si ce n'est même pas possible.
Est-ce une chose normale dans l'apprentissage du renforcement? Les modèles doivent-ils vraiment savoir quelles actions valides sont-ils tout le temps? Ne serait-il pas beaucoup plus agréable d'avoir un env.get_valid_actions()
Fonctions pour que le modèle sache quelles actions sont faisables? Ou est-ce en quelque sorte possible et je le manque?
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange