Frage

Ich brauche einen Benutzer Beitrag zu analysieren und kategorisieren. Zum Beispiel: Ich habe jeden Beitrag als „buy“ Post oder „verkaufen“ Post auf den Text basiert kategorisieren - „Ich bin auf der Suche nach verkaufen mein Haus“ wird kategorisiert als „verkaufen“. Das Problem ist, dass oft ist es nicht so einfach - „Ich bin auf der Suche, um loszuwerden, mein altes Haus“ muss auch als „verkaufen“ eingestuft werden. „Ich bin auf der Suche nach einem Haus“ wird zu „kaufen“. Ich würde auch diese Beiträge auf dem betreffenden Artikel basiert kategorisieren möchten - z. B. die Post über „buy“ kategorisiert werden würde und als „Haus“

Kann mir jemand einen guten Ansatz / guten Rahmen / Technik empfehlen, wenn es um die Analyse und Benutzereingaben zu verstehen? Danke.

War es hilfreich?

Lösung

Sie haben Recht; es ist eine harte Sache zu tun.

Yahoo! hat einen Ausdrucksextrahierung API / Web Service, den Sie nutzen können. Es ist eine ziemlich gute Möglichkeit, Sprachanalyse auf Ihrem eigenen Text zu verwenden, ohne eine Million Zeilen Code zu schreiben, es selbst zu tun. Ich habe es nicht verwendet wird, so dass ich habe keine Ahnung, wie gut es funktioniert mit ähnlichen Bedeutungen, wie Ihre Frage stellt.

Andere Tipps

Was du redest ist im Grunde ein Bayes-Filter Problem , auch für Spam verwendet Filterung. Siehe auch dieses Gespräch . Es ist ein ziemlich kompliziertes Gebiet.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top