Domanda

Ho un set di dati con informazioni come l'età, città, età dei bambini, ... e di conseguenza (conferma, accetta).

Per aiutare modellizzazione di "workflow", voglio creare automaticamente un albero decisionale basato sulla serie di dati precedenti.

Ho dare un'occhiata a http://en.wikipedia.org/wiki/Decision_tree_learning e so che il problema non è chiaramente evidente.

Voglio solo avere consigli su qualche algoritmo o alcune librerie su questo argomento che mi può aiutare nella promozione di un albero di decisione sulla base di campioni.

È stato utile?

Soluzione

Si dovrebbe dare un'occhiata a Weka , una basata su Java gratuito suite di apprendimento supervisionato.

Dopo aver convertito i dati in di Weka semplice basato su testo .arff formato , si dovrebbe essere in grado di utilizzare l'interfaccia GUI o riga di comando per allenarsi e testare una varietà di differenti classificatori su tali dati, tra cui:

  • alberi di decisione
  • reti neurali
  • sistemi basati su regole
  • support vector machines (SVM)
  • vari tipi di regressione

Sperimentare con questa interfaccia dovrebbe permettere di provare facilmente diversi classificatori e parametri di allenamento per determinare quali effettuano il migliore per i vostri dati.

Puoi anche utilizzare un'API per integrare Weka nel proprio codice sorgente .

Altri suggerimenti

Se si desidera confrontare le prestazioni di diversi tipi di alberi di decisione da Weka, vedere i risultati dei benchmark raccolti in TunedIT.org:

http://tunedit.org/results?d=UCI&a=Weka*tree .

Gioca con elenchi a discesa e modelli di nomi di algoritmi / set di dati per scegliere quali risultati devono essere presentati.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top