Come calcolare il guadagno delle informazioni in ID3?
-
05-11-2019 - |
Domanda
Sto cercando di implementare un classificatore di alberi decisionali usando Algoritmo ID3. Secondo Intelligenza arifificale - un approccio moderno, guadagno delle informazioni di attributo A
è dato da:
Gain(A) = B(p/p+n) - Remainder(A)
dove B
è l'entropia di una variabile casuale booleana e p
e n
sono il numero di esempi positivi e negativi nel set di allenamento.
La mia domanda è:
fare p
e n
fare sempre riferimento ad esempi nel set di dati completo o agli esempi rimanenti nella partizione corrente del set?
Se il primo si applicava, il valore di B
rimarrebbe fisso durante la procedura di allenamento. È corretto?
Nessuna soluzione corretta
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a cs.stackexchange