Perché AlphaGo e Alphago Zero includono la cronologia delle schede nelle caratteristiche di input

cs.stackexchange https://cs.stackexchange.com/questions/96045

Domanda

Sia AlphaGo che Alphago Zero includono gli stati della scheda precedente come caratteristiche di input (i piani "giri" per AlphaGo e i ripetuti aerei di storia a 8 fasi per Alphago Zero).

Qual è lo scopo di includere queste informazioni sulla cronologia nell'input alle reti neurali?

Se ignoriamo la regola KO, la mossa migliore in una posizione non dovrebbe dipendere dalla storia delle mosse che portano a quella posizione. Se non ignoriamo KO, un singolo passo della storia della tavola dovrebbe essere sufficiente nella stragrande maggioranza dei giochi, quindi tra cui 8 passaggi della storia sembra eccessivo (e forse anche dannoso, poiché se la stessa posizione fosse raggiunta da due percorsi diversi, La risposta appresa potrebbe non essere condivisa tra questi due percorsi).

Questo non sembra essere discusso in nessuno dei documenti o in nessuno dei report dei media che ho visto.

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a cs.stackexchange
scroll top