Frage

Ich bin auf der Suche nach Code oder ein Produkt oder eine Dienstleistung semantische Analyse von Text (Sätze und oder Absätze) zu tun, den Text durch die allgemeine Thema zu kategorisieren, z.B.

  • Finanzen
  • Unterhaltung
  • Technologie
  • Handel
  • Kunst
  • etc ...
War es hilfreich?

Lösung

Wenn Sie eine Reihe von Beispielen, die bereits kategorisiert wurden, können Sie diese verwenden, um einen Klassifikator zu trainieren. Dies ist ein sehr einfaches Dokument classfication Problem und jede Suite des maschinellen Lernens Tools werden die Algorithmen und Tutorials für diese haben. Zum Beispiel Besuche weka: http://www.cs.waikato.ac.nz / ml / weka /

oder Rapidminer: http://rapid-i.com/content/blogcategory/ 38/69 /

Wenn sich Ihre Bedürfnisse begrenzt sind, und Sie wollen nur eine einfache API, können Sie nicht falsch mit dieser Naive Bayes Bibliothek gehen: https://ci-bayes.dev.java.net/

Viel Glück!

Andere Tipps

Wenn Sie einen kommerziellen Service API zu bewerten, überprüfen Sie die VIKI-Engine-APIs: http://www.softwareevolution.it/en/products/viki-core -api.html

Es ist ein einfaches Json Service api mit bestimmten semantischen Funktionen zu verwenden.

sein würde dies eine Hilfe für Sie?

http://en.wikipedia.org/wiki/Document_classification

Es ist kein fertiges Produkt oder eine Dienstleistung, weder Code, aber es beschreibt die verschiedene Algorithmen, die für die semantische Analyse verwendet werden können. Googeln auf ein wenig weiter, ich glaube, dass es aus dem Labor noch nicht wirklich ist. Menschen vor allem mit KNN Algorithmen experimentieren, in coolen Sachen resultierende, aber nicht wirklich das, was Sie brauchen:

http://www.ebi.ac.uk/webservices/whatizit /info.jsf

Aber wenn es eine Software, die das tun, was Sie fragen, ist es in dieser Liste wäre:

http://www.kdnuggets.com/software/text.html

Zum Beispiel des LPU Programm, es scheint in der Lage zu sein, zu lernen, wenn Sie sie Dokumente genug Lehre ernähren.

http://www.cs.uic.edu/ ~ liub / LPU / LPU-download.html

Wenn Sie in Python / interpretierten Sprachen sind, dann überprüfen Sie den ausgezeichneten NLTK Rahmen bei nltk.org aus. Es hat eine ausgezeichnete, wie zu Seite und ein kürzlich O'Reilly Buch veröffentlicht.

Wenn Sie in Java sind und / oder erfordern eine reife, aber schwieriger zu erfassen Rahmen, versuchen GATE statt.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top