Есть ли система открытого исходного кода для поиска ключевых слов на XML-документы? [закрыто

StackOverflow https://stackoverflow.com/questions/2921379

Вопрос

Я нашел много баз данных XML с открытым исходным кодом (TPOX, Timber, DBXML), но они работают над XPath и XQuery, мне нужна система, которая разработана для «поиска ключевых слов на XML-документы».

Это было полезно?

Решение

Многие из баз данных XML предоставляют ключевые слова в документах XML в них. Вы не просто ограничены выражениями XPath. Вы можете сделать поиск ключевых слов во всех документах в базе данных.

Часто вы можете выразить ваши запросы ключевых слов (и обрабатывать результаты запроса) в XQuery. Смотрите существующие-дБ для примера: http://exist.sourceforge.net/kwic.html.

Есть поддержка ключевого слова ограничена определенными элементами, или вы могли бы просто сделать ключевое слово на документ в целом. См. Спекулярное спецификация XQuery Full-Text для всех вариантов: http://www.w3.org/tr/xPath-full-text-10/

Basex - это еще одна база данных XML с открытым исходным кодом, которая поддерживает полный текст (то есть поиск ключевых слов): http://www.inf.uni-konstanz.de/dbis/basex/

Если вы хотите поиск с открытым исходным кодом FullText без базы данных, хотя вы можете посмотреть на более старый XQENGINE - http://xqengine.sourceforge.net/ - Или, как кто-то еще сказал, просто используйте Lucene и индексируйте весь текст в документе.

Другие советы

Я не уверен, какой «поиск ключевых слов» является, но вы можете настроить поисковую систему, например, Lucene / Solr, чтобы индексировать ваши данные, а затем поиск через это.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top