Domanda

Sto cercando di fare Q-Learning con i giochi Atari usando il gym Il pacchetto di Python.

Voglio usare l'immagine come stato del mio algoritmo, ma ho avuto un dubbio: Lo stato è tutte le possibilità per tutti i pixel dell'immagine?

Ho visto molte implementazioni di learning e nella tabella Q memorizzano sempre tutti gli stati possibili come righe e le azioni come colonne (ad esempio, https://www.learndaca.com/tutorials/reinforcement-q-learning-cratch-python-openai-gym/)

Senza fare la matematica, tutti i possibili stati per, diciamo, un'immagine in scala di grigi 200x200 sono folli. Come posso gestire questo problema senza fare reti neurali?

Immagino che ci debba essere un approccio per questo scenario, ma non ho trovato alcun buon esempio.

Grazie!!

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top