Инструменты, доступные для выполнения семантического анализа текста

StackOverflow https://stackoverflow.com/questions/1717609

  •  19-09-2019
  •  | 
  •  

Вопрос

Я ищу код, продукт или услугу для выполнения семантического анализа текста (предложений и / или абзацев), чтобы классифицировать текст по общей теме, например

  • Финансы
  • Развлечения
  • ТЕХНОЛОГИЯ
  • Бизнес
  • Рисунки
  • и т.д...
Это было полезно?

Решение

Если у вас есть куча примеров, которые уже были классифицированы, вы можете использовать их для подготовки классификатора.Это очень простая задача классификации документов, и любой набор инструментов машинного обучения будет содержать алгоритмы и учебные пособия для этого.Например, посмотрите на weka: http://www.cs.waikato.ac.nz/ml/weka/

или rapidminer: http://rapid-i.com/content/blogcategory/38/69/

Если ваши потребности ограничены, и вам нужен просто простой API, вы не ошибетесь с этой наивной библиотекой Bayes: https://ci-bayes.dev.java.net/

Удачи вам!

Другие советы

Если вы хотите оценить коммерческий сервис API, ознакомьтесь с API-интерфейсами VIKI engine:http://www.softwareevolution.it/en/products/viki-core-api.html

Это простой в использовании Json service api со специфическими семантическими функциями.

Могло бы это вам как-нибудь помочь?

http://en.wikipedia.org/wiki/Document_classification

Это не готовый продукт или услуга, ни код, но в нем описываются различные алгоритмы, которые могут быть использованы для семантического анализа.Погуглив немного дальше, я полагаю, что на самом деле это еще не вышло за пределы лаборатории.Люди в основном экспериментируют с алгоритмами KNN, в результате чего получается классный материал, но не совсем то, что вам нужно:

http://www.ebi.ac.uk/webservices/whatizit/info.jsf

Но если есть какое-то программное обеспечение, которое будет делать то, что вы просите, оно должно быть в этом списке:

http://www.kdnuggets.com/software/text.html

Например, программа LPU, похоже, способна к обучению, если вы предоставите ей достаточное количество обучающих документов.

http://www.cs.uic.edu /~liub/LPU/LPU-download.html

Если вы увлекаетесь Python / интерпретируемыми языками, ознакомьтесь с отличным фреймворком NLTK по адресу nltk.org.В нем есть отличная страница с инструкциями и недавно опубликованная книга О'Рейли.

Если вы увлекаетесь Java и / или вам нужен более зрелый, но более сложный для понимания фреймворк, попробуйте ВОРОТА вместо этого.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top