DQN - valori target vs valori di azione?

https://datascience.stackexchange.com/questions/56116

reinforcement-learning
deep-learning
q-learning

02-11-2019
|

Domanda

Sto cercando di capire la differenza tra valori target e valori d'azione in reti profonde Q.

Da quello che ho capito, il valore d'azione cerca di approssimare la ricompensa di una determinata azione (in un certo stato). Il valore target è anche approssimativo della ricompensa. Come sono differenti?

Riferimento
- https://storage.googleapis.com/deepmind-media/dqn/dqnnaturepaper.pdf

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a datascience.stackexchange