Вопрос

Я был очень впечатлен системой OpenCalais.Это веб-сервис, куда вы отправляете свой текст, они анализируют его, затем вам предоставляется ряд категоризированных тегов (с поддержкой RDF), к которым относится ваш документ.

Но - на данный момент - английский является единственным поддерживаемым языком.

Знаете ли вы о подобных системах, которые обрабатывают многоязычные документы?(Меня интересует итальянский, но многоязычие, конечно, плюс)

Это было полезно?

Решение

Apache Станбол может анализировать тексты на самых разных языках.На данный момент поддерживаются следующие языки (значения точности и отзыва могут варьироваться в зависимости от языка):

  • Английский,
  • 中文文文 ( ( 中 (китайский),
  • Испанский (Spanish),
  • Русский (Russian),
  • Português (Portuguese),
  • Deutsch (German),
  • Italiano (Итальянский),
  • Нидерланды (голландский),
  • Свенская (шведский),
  • Данск (датский),
  • العربية (Arabic),
  • עברית (Hebrew),
  • 語本本 日 (японский).

Анализ вернет обнаруженные объекты.Формат вывода анализа может быть:

  • JSON-LD,
  • RDF/XML,
  • RDF/JSON,
  • Черепахи,
  • N-ТРОЕК.

Сущности, или пометки, текстов могут быть дополнительно адаптированы в соответствии с конфигурацией системы.В идеале любой пользовательский словарь может быть подключен к системе.

Есть пара демонстрационных конечных точек:

Не уверен, поддерживаются ли все вышеперечисленные языки в вышеупомянутых конечных точках.

RedLink GmbH собирается предоставлять облачные сервисы на базе Apache Stanbol и связанного с ним программного обеспечения.

Тот Самый Плагин WordLift for WordPress уже предоставляет анализ текста в WordPress для все вышеупомянутые языки (в настоящее время находится на стадии тестирования).Вы можете попробовать это, установив плагин в WordPress и отправив текстовое содержимое в теле сообщения.

Вы также можете подписаться и написать на Список рассылки Apache Stanbol для получения конкретных запросов или информации.

Другие советы

OpenCalais поддерживает метки французских и испанских метаданных для сущностей. Набор сущностей будет расширен в будущих выпусках. См. Нашу онлайн-документацию по адресу http://www.opencalais.com/documentation/calais. -web-сервис-апи

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top