verfügbare Tools semantische Analyse von Text zu tun
-
19-09-2019 - |
Frage
Ich bin auf der Suche nach Code oder ein Produkt oder eine Dienstleistung semantische Analyse von Text (Sätze und oder Absätze) zu tun, den Text durch die allgemeine Thema zu kategorisieren, z.B.
- Finanzen
- Unterhaltung
- Technologie
- Handel
- Kunst
- etc ...
Lösung
Wenn Sie eine Reihe von Beispielen, die bereits kategorisiert wurden, können Sie diese verwenden, um einen Klassifikator zu trainieren. Dies ist ein sehr einfaches Dokument classfication Problem und jede Suite des maschinellen Lernens Tools werden die Algorithmen und Tutorials für diese haben. Zum Beispiel Besuche weka: http://www.cs.waikato.ac.nz / ml / weka /
oder Rapidminer: http://rapid-i.com/content/blogcategory/ 38/69 /
Wenn sich Ihre Bedürfnisse begrenzt sind, und Sie wollen nur eine einfache API, können Sie nicht falsch mit dieser Naive Bayes Bibliothek gehen: https://ci-bayes.dev.java.net/
Viel Glück!
Andere Tipps
Wenn Sie einen kommerziellen Service API zu bewerten, überprüfen Sie die VIKI-Engine-APIs: http://www.softwareevolution.it/en/products/viki-core -api.html
Es ist ein einfaches Json Service api mit bestimmten semantischen Funktionen zu verwenden.
sein würde dies eine Hilfe für Sie?
http://en.wikipedia.org/wiki/Document_classification
Es ist kein fertiges Produkt oder eine Dienstleistung, weder Code, aber es beschreibt die verschiedene Algorithmen, die für die semantische Analyse verwendet werden können. Googeln auf ein wenig weiter, ich glaube, dass es aus dem Labor noch nicht wirklich ist. Menschen vor allem mit KNN Algorithmen experimentieren, in coolen Sachen resultierende, aber nicht wirklich das, was Sie brauchen:
http://www.ebi.ac.uk/webservices/whatizit /info.jsf
Aber wenn es eine Software, die das tun, was Sie fragen, ist es in dieser Liste wäre:
http://www.kdnuggets.com/software/text.html
Zum Beispiel des LPU Programm, es scheint in der Lage zu sein, zu lernen, wenn Sie sie Dokumente genug Lehre ernähren.
Wenn Sie in Python / interpretierten Sprachen sind, dann überprüfen Sie den ausgezeichneten NLTK Rahmen bei nltk.org aus. Es hat eine ausgezeichnete, wie zu Seite und ein kürzlich O'Reilly Buch veröffentlicht.
Wenn Sie in Java sind und / oder erfordern eine reife, aber schwieriger zu erfassen Rahmen, versuchen GATE statt.