Pregunta

Al crear un archivo de entrenamiento libsvm, ¿cómo diferenciar entre un atributo nominal versos un atributo numérico? Estoy tratando de codificar ciertos atributos nominales como enteros, pero quiero asegurar libsvm no malinterpretar como valores numéricos. Por desgracia, el sitio de libsvm parece tener muy poca documentación. docs Pentaho parecen implicar libsvm hace esta distinción, pero estoy todavía no está claro cómo es hecho.

¿Fue útil?

Solución

No hacer esto I'm trying to encode certain nominal attributes as integers.

Más bien, utilizar una función binaria independiente para cada valor de cada atributo nominal.

La forma SVMs se formulan, todos los atributos / características son numéricos y etiquetas de clase son nominales. atributos nominales son falsos esencialmente mediante el uso de características binarias que se excluyen mutuamente.

Otros consejos

creo que no puede hacer eso en libsvm, weka o SVM-luz. Un método que se puede utilizar es usar algo como un árbol de decisión para sus atributos nominales y SVM o cualquier clasificador basado en la distancia de sus atributos numéricos y luego combinar los resultados. Espero que ayude.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top