Pregunta

Estoy buscando una solución Java conducido a un requisito para el análisis de frases para iniciar la sesión si una palabra clave se utilizó positiva o negativamente.

Es decir, la palabra clave podría ser 'coles' y la frase: -

'me gusta coles, pero no los guisantes'

Y me gustaría un analizador de texto java de algún tipo para registrar esto como positivo. ¿Puede el Lucene (Hibernate-búsqueda) bibliotecas ser utilizado para esto?

¿Alguna idea?

¿Fue útil?

Solución

Usted está en busca de "análisis de los sentimientos". Una posibilidad es LingPipe , quien amablemente enlace rel="noreferrer"> . Jeff Dalton también tiene una gran lista de herramientas de procesamiento de lenguaje natural en su blog.

Otros consejos

dudo de que hay algo por el estilo. Lucene definitivamente no puede hacerlo fuera de la caja.

¿Cómo se puede incluso definir "si se utilizó una palabra clave positiva o negativa" de una manera que puede ser evaluada mediante programación? Para hacerlo correctamente, habría que analizar el texto de su significado real, que es un problema de IA que no es resuelto ni siquiera remotamente.

supongo que se podría resolverlo aproximadamente con sólo hacer un análisis estadístico de si la palabra clave aparece más a menudo cerca de palabras clave positivas (como, bueno, grande, maravilloso) o negativo (mal, el odio, malo, maldito), pero incluso allí, negaciones, sarcasmo y estructuras de frases complejas serán problemática.

Tome un vistazo a Mahout Sabor , que se basa en Lucene, pero añade un montón de lo que necesita salir De la caja. (Editar) Debo añadir, Mahout El gusto es meramente Relacionado a lo que estás buscando y no es una coincidencia del 100%.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top