¿Cuáles son los problemas más desafiantes en el análisis de sentimientos (minería de opinión)?

StackOverflow https://stackoverflow.com/questions/4806176

  •  24-10-2019
  •  | 
  •  

Pregunta

El análisis de minería/sentimiento de opinión es una subtarea algo reciente del procesamiento del lenguaje natural. Algunos comparan con la clasificación de texto, algunos adoptan una postura más profunda hacia él. ¿Qué opinas sobre los problemas más desafiantes en el análisis de sentimientos (minería de opinión)? ¿Puedes nombrar algunos?

¿Fue útil?

Solución

Los desafíos clave para el análisis de sentimientos son:-

1) Reconocimiento de entidad nombrado: ¿De qué está hablando la persona realmente, por ejemplo, es 300 espartanos un grupo de griegos o una película?

2) Resolución de anáfora: el problema de resolver a qué se refiere un pronombre o una frase nominal. "Vimos la película y fuimos a cenar; fue horrible". ¿A que se refiere?

3) Analización: ¿Cuál es el sujeto y el objeto de la oración, a cuál se refiere el verbo y/o el adjetivo?

4) Sarcasmo: si no conoce al autor, no tiene idea de si "malo" significa malo o bueno.

5) Twitter: abreviaturas, falta de capitales, pobre ortografía, pobre puntuación, pobre gramática, ...

Otros consejos

Estoy de acuerdo con Hightechrider en que esas son áreas donde la precisión del análisis de sentimientos puede ver la mejora. También agregaría que el análisis de sentimientos tiende a hacerse en el texto de dominio cerrado en su mayor parte. Los intentos de hacerlo en el texto de dominio abierto generalmente termina teniendo una medida de precisión/F1 muy mala/lo que tiene usted o de lo contrario es el dominio pseudo-abierto porque solo mira ciertas construcciones gramaticales. Por lo tanto, diría que el análisis de sentimientos sensibles al tema que puede identificar el contexto y tomar decisiones basadas en que eso es un área emocionante para la investigación (y los productos de la industria).

También ampliaría su quinto punto de Twitter a otros sitios de redes sociales (por ejemplo, Facebook, YouTube), donde las expresiones cortas y no gramaticales son comunes.

Creo que la respuesta es la complejidad del lenguaje, los errores en la gramática y la ortografía. Hay una gran forma en que las personas expresan sus opiniones, por ejemplo, los sarcasmos podrían interpretarse erróneamente como un sentimiento extremadamente positivo.

La pregunta puede ser demasiado genérica, porque hay varios tipos de análisis de sentimientos (nivel de documento, nivel de oración, análisis de sentimientos comparativos, etc.) y cada tipo tiene algunos problemas específicos.

En términos generales, estoy de acuerdo con la respuesta de @ian Mercer, y agregaría otros 3 problemas:

  • Cómo detectar un sentimiento/emoción más profundamente en profundidad. Positivo y negativo es un análisis muy simple, uno de los desafíos es cómo extraer emociones como cuánto odio hay dentro de la opinión, cuánta felicidad, cuánta tristeza, etc.
  • Cómo detectar el objeto que la opinión es positiva y el objeto por el que la opinión es negativa. Por ejemplo, si dices "¡Ella lo ganó!", Esto significa un sentimiento positivo para ella y un sentimiento negativo para él, al mismo tiempo.
  • Cómo analizar oraciones o párrafos muy subjetivos. A veces, incluso para los humanos, es muy difícil estar de acuerdo en el sentimiento de estos textos subjetivos altos. Imagínese para una computadora ...
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top