我正在考虑为我的一个项目创建全文搜索引擎。我们有一个需要索引的MySQL,东京暴君和文件文件。

我现在正在看Sphinx,但我无法弄清楚是否可以使用它来索引每个文档。

我知道可以让Sphinx使用MySQL,但我正在寻找一种让Sphinx索引和查询Tokyo Tykyo Tyrant以及索引文件文档的方法。

它可以是狮身人面像或Xapian或另一个,但没有Java(Lucene Out),但可以与PHP一起使用并在Linux上运行。

是否有任何可以接受MySQL作为来源的搜索引擎的想法?

谢谢

有帮助吗?

解决方案

您可以使用任何来源将数据发送到Sphinx xmlpipe2

您只需要编写一些代码(可能是PHP)即可从东京暴君(Tokyo Tyrant)阅读(不确定是什么,所以您自己在那里)以及文件系统并将其全部包装为XML。然后,您只需设置Sphinx源即可运行执行自定义代码的命令,而Sphinx会照顾其余的。

其他提示

如果您没有太多的文档,并且只想使用PHP,则应查看 Zend_Search_Lucene :

Zend_search_lucene是完全写在PHP 5中的通用文本搜索引擎。由于它将其索引存储在文件系统上并且不需要数据库服务器,因此它可以将搜索功能添加到几乎任何PHP驱动的网站上。

不过,如果您使用自己的服务器,则可以安装软件,这意味着您可以部署Sphinx的Lucence/Solr,即使它们不仅以PHP的形式编写 - 如果您需要,这实际上可能是一个更安全的解决方案索引很多内容。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top