Question

J'essaye de comprendre la différence entre valeurs cibles et valeurs d'action Dans les réseaux profonds Q.

D'après ce que je comprends, la valeur d'action essaie d'approximer la récompense d'une action donnée (à un État). La valeur cible est également approximative de la récompense. Comment sont-ils différents?

Référence
- https://storage.googleapis.com/deepmind-media/dqn/dqnnaturepaper.pdf

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
scroll top