予具有相对简单的Lucene索引,通过Solr的投放。该指数由两个主要领域,标题和正文,和一些不太重要的领域。

大多数搜索引擎提供更多的相关性结果与标题匹配,遍布全身。我要开始提供索引时推动的标题字段。

我的问题是,什么样的价值观中,人们通常使用他们的头衔领域? 2? 4? 10? 100?

有帮助吗?

解决方案

建议你除以平均标题长度正中体长度。这大致给你一个因子M - 在体字的M个出场,这将在标题中出现一次。 现在,使用像M * 3。这是当然,合理化的启发,它是最好的,你遍历值。请参见格兰特英格索尔的“调试相关问题研究搜索“一个更加结构化的讨论。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top