题
予具有相对简单的Lucene索引,通过Solr的投放。该指数由两个主要领域,标题和正文,和一些不太重要的领域。
大多数搜索引擎提供更多的相关性结果与标题匹配,遍布全身。我要开始提供索引时推动的标题字段。
我的问题是,什么样的价值观中,人们通常使用他们的头衔领域? 2? 4? 10? 100?
解决方案
建议你除以平均标题长度正中体长度。这大致给你一个因子M - 在体字的M个出场,这将在标题中出现一次。 现在,使用像M * 3。这是当然,合理化的启发,它是最好的,你遍历值。请参见格兰特英格索尔的“调试相关问题研究搜索“一个更加结构化的讨论。
不隶属于 StackOverflow