Frage

Es scheint, dass die einfachste, naivest Art und Weise grundlegende Sentiment-Analyse zu tun, mit einem Bayes-Klassifikator ist (bestätigt durch das, was ich hier auf SO bin zu finden). Etwaige Gegenargumente oder andere Vorschläge?

War es hilfreich?

Lösung

Ein Bayes-Klassifikator mit einer Tasche von Worten Darstellung ist die einfachste statistische Methode. Sie können, indem auf fortgeschrittenere Klassifizierer und Feature-Repräsentation, auf Kosten von mehr Komplexität deutlich bessere Ergebnisse erzielen.

Statistische Methoden sind nicht das einzige Spiel in der Stadt. Regelbasierte Methoden, die mehr Verständnis für die Struktur des Textes haben, sind die andere Haupt Option. Von dem, was ich gesehen habe, dies führe eigentlich nicht so gut wie statistische Methoden.

Ich empfehle Manning und Schützes Foundations of Statistical Natural Language Processing Kapitel 16, Text Kategorisierungs.

Andere Tipps

Ich kann nicht glauben, von einer einfacheren, naiven Art und Weise Sentiment Analysis zu tun, aber Sie könnten eine Support Vector Machine statt Naive Bayes prüfen, mit (in einigem maschinellen Lernen Toolkits, das ist eine Drop-in-Ersatz sein kann). Werfen Sie einen Blick auf „Thumbs up? Sentiment Klassifizierung mit den Techniken des maschinellen Lernens“ von Bo Pang, Lillian Lee und Shivakumar Vaithyanathan denen war eine der frühesten Arbeiten zu diesen Techniken und gibt einen guten Tisch Genauigkeits Ergebnisse auf einer Familie verwandter Techniken, von denen keines mehr kompliziert sind (von a Kundenperspektive) als alle anderen.

Aufbauend auf der Antwort von Ken bereitgestellt oben gibt es ein weiteres Papier

"Sentiment-Analyse unter Verwendung Support-Vektor-Maschinen mit unterschiedlichen Informationsquellen" von Tony und Niger,

, die schaut auf mehr Funktionen als nur eine Tasche von Wörtern von Pang und Lee verwendet zuweisen. Hier werden sie nutzen wordnet semantische Differenzierung von Adjektiven, um zu bestimmen, und der Nähe der Stimmung gegenüber dem Thema im Text als zusätzliche Funktionen für die SVM. Sie zeigen bessere Ergebnisse als frühere Versuche Text auf der Stimmung zu klassifizieren.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top