Лучший алгоритм обучения для создания дерева решений в Java?
-
21-09-2019 - |
Вопрос
У меня есть наборы данных с такой информацией, как возраст, город, возраст детей и т. д.и результат (подтвердить, принять).
Чтобы облегчить моделирование «рабочего процесса», я хочу автоматически создать дерево решений на основе предыдущих наборов данных.
Я взглянул на http://en.wikipedia.org/wiki/Decision_tree_learning и я знаю, что проблема явно не очевидна.
Я просто хочу получить совет по поводу какого-нибудь алгоритма или некоторых библиотек по этой теме, которые могут помочь мне в построении дерева решений на основе образцов.
Решение
Вам следует взглянуть на Века, бесплатный пакет контролируемого обучения на основе Java.
После преобразования ваших данных в простой текстовый формат Weka формат .arff, вы должны иметь возможность использовать графический интерфейс или интерфейс командной строки для обучения и тестирования различных классификаторов на этих данных, в том числе:
- деревья решений
- нейронные сети
- системы, основанные на правилах
- машины опорных векторов (SVM)
- различные виды регрессии
Экспериментирование с этим интерфейсом должно позволить вам легко опробовать различные классификаторы и параметры обучения, чтобы определить, какие из них лучше всего работают с вашими данными.
Вы также можете используйте API для интеграции Weka в ваш собственный исходный код.
Другие советы
Если вы хотите сравнить производительность различных типов деревьев решений от Weka, см. результаты тестов, собранные на TunedIT.org:
http://tunedit.org/results?d=UCI&a=Weka*tree.
Поиграйте с раскрывающимися списками и назовите шаблоны алгоритмов/наборов данных, чтобы выбрать, какие результаты следует представлять.