Pregunta

Me estoy interesado en hacer uso de la categorización de textos LibSVM. Como recomiendan convierto los términos / palabras de datos numéricos, por lo LibSVM puede entenderlo?

Gracias!

¿Fue útil?

Solución

En el texto de categorización personas tienden a construir histogramas de las palabras utilizadas en el dominio, a veces se ven en combinaciones de dos palabras y poner que en su histograma (esto se llama Bigramas). Pero realmente depende de sus datos y sus objetivos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top