libSVM de datos y no numéricos
-
28-09-2019 - |
Pregunta
Me estoy interesado en hacer uso de la categorización de textos LibSVM. Como recomiendan convierto los términos / palabras de datos numéricos, por lo LibSVM puede entenderlo?
Gracias!
Solución
En el texto de categorización personas tienden a construir histogramas de las palabras utilizadas en el dominio, a veces se ven en combinaciones de dos palabras y poner que en su histograma (esto se llama Bigramas). Pero realmente depende de sus datos y sus objetivos.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow