Pourquoi Alphago et Alphago Zero incluent l'historique du conseil d'administration dans les fonctionnalités d'entrée

cs.stackexchange https://cs.stackexchange.com/questions/96045

Question

Alphago et Alphago Zero incluent les états de la carte antérieurs en tant que fonctionnalités d'entrée (les avions "tourne depuis" pour Alphago, et les plans d'historique répétés en 8 étapes pour Alphago Zero).

Quel est le but d'inclure ces informations historiques dans la contribution aux réseaux de neurones?

Si nous ignorons la règle KO, le meilleur mouvement à une position ne devrait pas dépendre de l'histoire des mouvements menant à cette position. Si nous n'ignorons pas KO, une seule étape de l'histoire du conseil d'administration devrait être suffisante dans la grande majorité des jeux, donc l'inclusion de 8 étapes de l'histoire semble excessive (et peut-être même nocif, car si la même position était atteinte par deux chemins différents, La réponse apprise pourrait ne pas être partagée entre ces deux chemins).

Cela ne semble pas être discuté dans aucun des articles, ni dans aucun des rapports des médias que j'ai vus.

Pas de solution correcte

Licencié sous: CC-BY-SA avec attribution
Non affilié à cs.stackexchange
scroll top