XMLドキュメントでキーワード検索のためのオープンソースシステムはありますか? [閉まっている
-
05-10-2019 - |
質問
オープンソースXMLデータベース(TPOX、TIMBER、DBXML)がたくさん見つかりましたが、XPathとXQueryで作業しているため、「XMLドキュメントのキーワード検索」を目的としたシステムが必要です。
解決
XMLデータベースの多くは、XMLドキュメントのキーワードインデックスを提供しています。 Xpathの表現に限定されているだけではありません。データベース内のすべてのドキュメントでキーワード検索を行うことができます。
多くの場合、Xqueryでキーワードクエリを表現する(およびクエリの結果を処理する)ことができます。例については、存在-DBを参照してください。 http://exist.sourceforge.net/kwic.html
特定の要素に限定されたキーワードのサポートがあります。そうでないと、ドキュメント全体でキーワードを実行できます。すべてのオプションについては、Xqueryフルテキスト仕様を参照してください。 http://www.w3.org/tr/xpath-full-text-10/
Basexは、フルテキスト(つまりキーワード検索)スペックをサポートする別のオープンソースXMLデータベースです。 http://www.inf.uni-konstanz.de/dbis/basex/
データベースなしでオープンソースのフルテキスト検索が必要な場合は、古いXQENGINEをご覧ください - http://xqengine.sourceforge.net/ - または、他の誰かが言ったように、Luceneを使用して、すべてのテキストをドキュメント内のすべてのテキストにそのようにインデックスするだけです。
他のヒント
「キーワード検索」とは何かわかりませんが、Lucene/solrなどの検索エンジンを設定してデータをインデックス付けして、それを検索できます。