我是一家新公司,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用Salesforce或其他ECM等外部服务提供商,将来将有很多集成工作。从客户的角度来看,这些文档也将与我们的结构化内容(存储在DB,而不是MS Word Doc)中存在。

如果您已经实施了文档搜索,则使用了哪些语言,框架和技术?你有失败的故事吗?我没有开箱即用的东西有问题,但是我认为我们对文档和API的控制很重要。如果我们完全自定义,我想使用导轨。

有帮助吗?

解决方案

取决于您的许可需求 露西恩 (LGPL)和 Xapian (GPL)两者都是很棒的,成熟的,快速的搜索引擎API,并具有许多语言的绑定。我已经成功地使用了他们两个。

其他提示

露西恩 可能是最安全的选择,因为它被广泛使用且相当不错。

从Lucene中受益最简单的方法可能是 alfresco, ,这是轻而易举的安装,默认情况下具有Lucene。这意味着您只需要安装Alfresco,将文档放入存储库中,就可以使用功能强大的Web搜索界面搜索文档。

如果您需要以编程方式搜索,我的建议是使用alfresco' CMIS 接口,它使您可以以休息方式进行搜索。 JCR API也可用。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top