Solr:特典にはどんなものがありますかの長さの正常化/omitNorms=false?

https://stackoverflow.com/questions/6830795

27-10-2019
|

質問

まだ"Solr検索条の様々な長さのものがある。また指数の両方の記述メタデータ（タイトル、著者名、カテゴリキーワードなど、全ての記事です。いたしませんの向性のインデックスを時間すべての向上を行ないクエリの時間を使用していまdismax、様々なqf、pf、bf幅).

現在のfulltextの分野の標準omitNorms=false;結果として、他のものはみな後からつ平等に、短い記事(2-3列インチの記事）の頻度が高い関連性による長編(マルチページ)。

当社の場合は第長が重要な指標との関連性で考えてい設定omitNorms=trueてお待ちます。

ご質問:1.なぜデフォルトの可能/solrの挙動向短い分野の長さ以上の高?の推論?2.なぜいたくないomitNorms?い上げる必要がある質問この特定の分野でも使うfacetingこの分野です。

解決

質問1

増短い分野の長さ以上の高分野の長い基礎的概念を決定する文書の関連性とTF-IDFを参照 http://en.wikipedia.org/wiki/Tf%E2%80%93idf).Shortとしてとえば、次の検索返される二つの書類:最初の100の言葉第二は、1,000ます。それぞれ検索キーワードだけます。以降のキーワードの最初の文書の1%の文字の短い文書であるものと判断する目的は、以下の通りで検索条件の文書が検索したキーワードでした0.1%のです。

質問2

そのようなお客様のご要望に基づき、いを省略規範を遵守します。しかし、この場合にスキューの検索結果の方法が見つからない.できたことから一部の物件の長さの正常化がなを実現します。もう一つのアプローチが実際に書店長としてのある種のタグ分野などの表示の書類として"短く"、"medium"、"長"を促書類に一致する長い長中などを実行します。これもエンドユーザーのフィルタのドキュメントの長さい。

ります。も素敵な特性の長さを正常化すると思いる場合、超長が存在する条に触れる10の異なるテーマの1試合は、ユーザの検索や長い記事が存在することを話1話題にしたものを検索します。この場合、あるんだろう好の条の超長（場合においても超長条に一致した検索キーワードによります。でりお客様のデータをご利用例です。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow