我发现了很多开源XML数据库(TPOX,TIMBER,DBXML),但是它们正在XPATH和XQUERY上工作,我需要一个系统,该系统是为了“ XML文档上的关键字搜索”而开发的。

有帮助吗?

解决方案

许多XML数据库提供了其中XML文档的关键字索引。您不仅限于Xpath表达方式。您可以在数据库中的所有文档上进行关键字搜索。

通常,您可以在Xquery中表达关键字查询(并处理查询的结果)。有关一个示例,请参见存在-DB: http://exist.sourceforge.net/kwic.html

支持关键字仅限于特定元素,或者您可以在整个文档中进行关键字。请参阅所有选项的XQUERY全文规格: http://www.w3.org/tr/xpath-full-text-10/

Basex是另一个支持全文网文(IE关键字搜索)规范的开源XML数据库: http://www.inf.uni-konstanz.de/dbis/basex/

如果您想要开源FullText搜索而没有数据库,尽管您可能想查看旧的XQENGINE- http://xqengine.sourceforge.net/ - 或者,就像其他人所说的那样,只需在文档中使用Lucene并索引所有文本。

其他提示

我不确定什么是“关键字搜索”,但是您可以设置搜索引擎,例如Lucene/Solr来索引您的数据,然后搜索该引擎。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top