Многоязычная система, подобная OpenCalais?
-
11-07-2019 - |
Вопрос
Я был очень впечатлен системой OpenCalais.Это веб-сервис, куда вы отправляете свой текст, они анализируют его, затем вам предоставляется ряд категоризированных тегов (с поддержкой RDF), к которым относится ваш документ.
Но - на данный момент - английский является единственным поддерживаемым языком.
Знаете ли вы о подобных системах, которые обрабатывают многоязычные документы?(Меня интересует итальянский, но многоязычие, конечно, плюс)
Решение
Apache Станбол может анализировать тексты на самых разных языках.На данный момент поддерживаются следующие языки (значения точности и отзыва могут варьироваться в зависимости от языка):
- Английский,
- 中文文文 ( ( 中 (китайский),
- Испанский (Spanish),
- Русский (Russian),
- Português (Portuguese),
- Deutsch (German),
- Italiano (Итальянский),
- Нидерланды (голландский),
- Свенская (шведский),
- Данск (датский),
- العربية (Arabic),
- עברית (Hebrew),
- 語本本 日 (японский).
Анализ вернет обнаруженные объекты.Формат вывода анализа может быть:
- JSON-LD,
- RDF/XML,
- RDF/JSON,
- Черепахи,
- N-ТРОЕК.
Сущности, или пометки, текстов могут быть дополнительно адаптированы в соответствии с конфигурацией системы.В идеале любой пользовательский словарь может быть подключен к системе.
Есть пара демонстрационных конечных точек:
Не уверен, поддерживаются ли все вышеперечисленные языки в вышеупомянутых конечных точках.
RedLink GmbH собирается предоставлять облачные сервисы на базе Apache Stanbol и связанного с ним программного обеспечения.
Тот Самый Плагин WordLift for WordPress уже предоставляет анализ текста в WordPress для все вышеупомянутые языки (в настоящее время находится на стадии тестирования).Вы можете попробовать это, установив плагин в WordPress и отправив текстовое содержимое в теле сообщения.
Вы также можете подписаться и написать на Список рассылки Apache Stanbol для получения конкретных запросов или информации.
Другие советы
OpenCalais поддерживает метки французских и испанских метаданных для сущностей. Набор сущностей будет расширен в будущих выпусках. См. Нашу онлайн-документацию по адресу http://www.opencalais.com/documentation/calais. -web-сервис-апи