Есть ли система открытого исходного кода для поиска ключевых слов на XML-документы? [закрыто
-
05-10-2019 - |
Вопрос
Я нашел много баз данных XML с открытым исходным кодом (TPOX, Timber, DBXML), но они работают над XPath и XQuery, мне нужна система, которая разработана для «поиска ключевых слов на XML-документы».
Решение
Многие из баз данных XML предоставляют ключевые слова в документах XML в них. Вы не просто ограничены выражениями XPath. Вы можете сделать поиск ключевых слов во всех документах в базе данных.
Часто вы можете выразить ваши запросы ключевых слов (и обрабатывать результаты запроса) в XQuery. Смотрите существующие-дБ для примера: http://exist.sourceforge.net/kwic.html.
Есть поддержка ключевого слова ограничена определенными элементами, или вы могли бы просто сделать ключевое слово на документ в целом. См. Спекулярное спецификация XQuery Full-Text для всех вариантов: http://www.w3.org/tr/xPath-full-text-10/
Basex - это еще одна база данных XML с открытым исходным кодом, которая поддерживает полный текст (то есть поиск ключевых слов): http://www.inf.uni-konstanz.de/dbis/basex/
Если вы хотите поиск с открытым исходным кодом FullText без базы данных, хотя вы можете посмотреть на более старый XQENGINE - http://xqengine.sourceforge.net/ - Или, как кто-то еще сказал, просто используйте Lucene и индексируйте весь текст в документе.
Другие советы
Я не уверен, какой «поиск ключевых слов» является, но вы можете настроить поисковую систему, например, Lucene / Solr, чтобы индексировать ваши данные, а затем поиск через это.