質問

ユーザーが行った検索に応じて、ウェブサイトにトレンドタグを追加したいと思います。単純な解決策が見つからない問題は、検索文字列から重要な用語を簡単に抽出する方法です。たとえば、多くのユーザーが「visual studio」を検索する場合があります。さまざまな目的で。たとえば、「visual studio 2010」、「visual studio unit testing」、「visual studio web forms components」などです。これら3回の検索では、「ビジュアルスタジオ」トレンドです。 「ビジュアルスタジオ」以来、どのようにアルゴリズムがそれに気付くことができますか?ほとんどの場合、他の多くの単語と混合されますか?

ありがとう!

役に立ちましたか?

解決

  1. すべての検索クエリを単一の単語の配列に分割します。
  2. 単語間の距離を計算します(より近いほど、より良い== gt;より高い値)
  3. すべてのクエリの各単語ペアにこの単語の距離を追加します。

より高い値を持つ単語ペアは、「トレンドタグ」です。

他のヒント

このcodeplexプロジェクトをご覧ください

http://www.codeplex.com/TheTagCloud

入力としてhtmlファイルを渡すことができ、タグクラウドを返す関数が含まれています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top