Analyse simple Sentiment

https://stackoverflow.com/questions/1082789

nlp
bayesian

23-08-2019
|

Question

Il semble que le plus simple, naivest façon de faire l'analyse des sentiments de base est un classificateur bayésien (confirmé par ce que je trouve ici sur SO). Tous les contre-arguments ou d'autres suggestions?

La solution

Un classificateur bayésien avec un sac de représentation de mots est la méthode la plus simple statistique. Vous pouvez obtenir des résultats significativement meilleurs en passant à classificateurs plus avancés et la représentation des caractéristiques, au prix de plus de complexité.

Les méthodes statistiques ne sont pas le seul jeu en ville. méthodes à base de règles qui ont une meilleure compréhension de la structure du texte sont l'autre option principale. D'après ce que je l'ai vu, ceux-ci ne fonctionnent pas en réalité aussi bien que les méthodes statistiques.

Je recommande Manning et les fondations de Schütze du chapitre statistique Traitement du langage naturel 16, Catégorisation de texte.

Autres conseils

Je ne peux pas penser à une simple façon plus naïve de faire l'analyse des sentiments, mais vous pouvez envisager d'utiliser une place Vector Machine support de Naive Bayes (dans certains kits d'outils d'apprentissage de la machine, cela peut être un remplacement impromptus). Jetez un oeil à "thumbs up? Classification en utilisant des techniques de sentiment d'apprentissage de la machine" par Bo Pang, Lillian Lee et Shivakumar Vaithyanathan qui a été l'un des premiers articles sur ces techniques, et donne une bonne table des résultats de précision sur une famille de techniques connexes, dont aucune ne plus compliquée (d'un point de vue du client) que tous les autres.

Renforcement de la réponse fournie par Ken ci-dessus, il y a un autre document

"L'analyse des sentiments à l'aide de vecteurs support machines avec des sources d'information diverses" par Tony et le Niger,

qui regarde attribuer plus de fonctionnalités que juste un sac de mots utilisés par Pang et Lee. Ici, ils exploitent WordNet pour déterminer la différenciation sémantique des adjectifs, et la proximité du sentiment à l'égard du sujet dans le texte, que des fonctionnalités supplémentaires pour SVM. Ils montrent de meilleurs résultats que les précédentes tentatives de classer le texte basé sur le sentiment.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow