Pregunta

Estoy evaluando paquetes de datamining.
He encontrado estos dos hasta ahora:

  • RapidMiner
  • Weka
  • ¿Tiene alguna experiencia para compartir con estos dos productos o algún otro producto que me recomiende?
    Gracias

    ¿Fue útil?

    Solución

    De acuerdo con las encuestas anuales de KDnuggets de 2007, 2008 y 2009, RapidMiner es la solución de minería de datos de fuente abierta más ampliamente utilizada entre los expertos en minería de datos de todo el mundo: Encuesta de la herramienta de minería de datos de KDnuggets 2009

    RapidMiner es de código abierto y 100% Java, RapidMiner es mucho más flexible y ofrece una funcionalidad significativamente mayor que Weka y KNIME.

    Con respecto a las implementaciones de SVM: Weka viene con una implementación de este tipo (LibSVM), mientras que RapidMiner proporciona cuatro implementaciones de SVM (LibSVM, MySVM, EvoSVM, SMO-SVM), algunas de ellas con características más avanzadas.

    Otros consejos

    Otra alternativa sería Orange . Incluye varios algoritmos y técnicas de extracción de datos a los que puede acceder directamente a través de scripts de Python o mediante GUI.

    ¡Reinventa la rueda y el código directamente en R!

    Pentaho es un buen traje para Business Intelligence. Así que tal vez te gustaría echarle un vistazo. Tengo algo de experiencia en esto, principalmente para el almacenamiento de datos y estaba bastante contento.

    Si está interesado en algún código Java relacionado con minería de patrones frecuentes, reglas de asociación y minería de patrones secuenciales , tengo un pequeño proyecto de código abierto que tiene 42 algoritmos relacionado con estos temas: http://www.philippe-fournier-viger.com/spmf/

    Sin embargo, tenga en cuenta que no proporciona ninguna interfaz de usuario. Pero proporciona algunos algoritmos muy especializados que no encontrará en otros paquetes de minería de datos.

    He usado Weka en un curso de secundaria, y tuvo un buen Implementación de SVM . Esto fue hace 4 o 5 años.

    ( KNIME ) es una plataforma de extracción de datos bastante extensa.

    Según la encuesta de KDnuggets 2011, RapidMiner, una vez más, es la solución de minería de datos más utilizada en todo el mundo: http://www.kdnuggets.com/2011/05 /tools-used-analytics-data-mining.html

    Echa un vistazo a ELKI , que es como WEKA, excepto que es mucho más fuerte en La agrupación y la detección de valores atípicos, mientras que WEKA esencialmente solo hace bien la clasificación.

    Como se dijo antes, Pentaho es una poderosa suite de Business Intelligence a la que pertenece WEKA.

    Por lo tanto, también recomendaría a Weka, solo por el hecho de que tiene una gran solución para extender su aplicación y también una gran comunidad.

    Licenciado bajo: CC-BY-SA con atribución
    No afiliado a StackOverflow
    scroll top