Question

Pourquoi les environnements de gym ne sont-ils pas livrés avec des "actions valides"? L'environnement de gymnase normal accepte comme entrée toute action, même si ce n'est même pas possible.

Est-ce une chose normale dans l'apprentissage du renforcement? Les modèles doivent-ils vraiment savoir quelles actions valides sont-ils tout le temps? Ne serait-il pas beaucoup plus agréable d'avoir un env.get_valid_actions() Fonctions pour que le modèle sache quelles actions sont faisables? Ou est-ce en quelque sorte possible et je le manque?

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
scroll top