Pregunta

Tengo que analizar a los usuarios' post y clasificar.Por ejemplo:Tengo que clasificar cada post como una "compra" de correos o a un "vender" mensaje basado en el texto - "estoy buscando a la vender mi casa", se clasifica como "vender".El problema es que a menudo no es tan simple - "yo estoy buscando para deshacerse de mi vieja casa" también debe ser categorizado como "vender"."Estoy buscando una casa" se convierte en "comprar".También me gustaría clasificar estos puestos se basa en el elemento en cuestión - por ejemplo, el post anterior iba a ser clasificados como "comprar" y como "casa".

¿Alguien puede recomendar un buen enfoque / buen marco / técnica cuando se trata de analizar y comprender de entrada de usuario?Gracias.

¿Fue útil?

Solución

Tienes razón; es una cosa difícil de hacer.

Yahoo! tiene un Extracción de términos servicio API / Web que puede utilizar. Es una muy buena manera de utilizar el análisis del lenguaje en su propio texto sin escribir un millón de líneas de código para hacerlo usted mismo. No he utilizado, así que no tengo idea de lo bien que funciona con significados similares, ya que su pregunta se refiere.

Otros consejos

Lo que estamos hablando es básicamente un problema filtrado bayesiano, también se utiliza para el spam filtración. Ver también esta charla . Es una zona bastante complicada.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top