我不久前实现了一个 Lucene 搜索解决方案,它让我对可搜索的压缩文件索引产生了兴趣。当时我找不到任何关于如何创建自定义搜索索引的好信息,所以我想知道是否有人可以为我指出正确的方向?

我的主要兴趣是文件格式化、压缩以及类似于 Lucene 文档和字段的概念。它不一定是特定于语言的,但如果您可以向我指出具有特定于语言的实现以及过程的完整描述的在线资源,那么也可以。

有帮助吗?

解决方案

管理千兆字节 作者:阿利斯泰尔·莫法特、蒂莫西·C.钟

Managing Gigabytes cover

其他提示

您也可以尝试查看优秀的源代码 狮身人面像 搜索引擎。

它是现代全文开源搜索引擎,它使用智能优化的索引。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top