Question

J'ai des ensembles de données avec des informations comme l'âge, la ville, l'âge des enfants, ... et un résultat (confirmer, accepter).

Pour aider modelisation de « workflow », je veux créer automatiquement un arbre de décision fondée sur des ensembles de données précédents.

Je jeter un oeil à http://en.wikipedia.org/wiki/Decision_tree_learning et je sais que le problème est clairement pas évident.

Je veux juste avoir des conseils sur un algorithme ou quelques libs sur ce sujet ce qui peut me aider dans la contruction d'un arbre de décision fondée sur des échantillons.

Était-ce utile?

La solution

Vous devriez jeter un oeil à Weka

Après la conversion de vos données dans un texte simple basé .arff le format Weka, vous devriez être en mesure d'utiliser l'interface utilisateur graphique ou de l'interface de ligne de commande pour entraîner et tester une variété de différents classificateurs sur ces données, y compris:

  • arbres de décision
  • réseaux de neurones
  • systèmes à base de règles
  • les machines à vecteurs (SVM)
  • différents types de régression

Expérimenter avec cette interface devrait vous permettre d'essayer facilement différents classificateurs et les paramètres de formation afin de déterminer quels sont ceux qui obtiennent les meilleurs résultats sur vos données.

Vous pouvez également utiliser une API pour intégrer Weka dans votre propre code source .

Autres conseils

Si vous voulez comparer les performances des différents types d'arbres de décision de Weka, voir les résultats de référence recueillies dans TunedIT.org:

http://tunedit.org/results?d=UCI&a=Weka*tree .

Jouez avec listes déroulantes et modèles de nom d'algorithmes / ensembles de données pour choisir les résultats devraient être présentés.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top