Domanda

Sto cercando di implementare un classificatore di alberi decisionali usando Algoritmo ID3. Secondo Intelligenza arifificale - un approccio moderno, guadagno delle informazioni di attributo A è dato da:

Gain(A) = B(p/p+n) - Remainder(A)

dove B è l'entropia di una variabile casuale booleana e p e n sono il numero di esempi positivi e negativi nel set di allenamento.

La mia domanda è:

fare p e n fare sempre riferimento ad esempi nel set di dati completo o agli esempi rimanenti nella partizione corrente del set?

Se il primo si applicava, il valore di B rimarrebbe fisso durante la procedura di allenamento. È corretto?

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a cs.stackexchange
scroll top