質問
ユーザーが行った検索に応じて、ウェブサイトにトレンドタグを追加したいと思います。単純な解決策が見つからない問題は、検索文字列から重要な用語を簡単に抽出する方法です。たとえば、多くのユーザーが「visual studio」を検索する場合があります。さまざまな目的で。たとえば、「visual studio 2010」、「visual studio unit testing」、「visual studio web forms components」などです。これら3回の検索では、「ビジュアルスタジオ」トレンドです。 「ビジュアルスタジオ」以来、どのようにアルゴリズムがそれに気付くことができますか?ほとんどの場合、他の多くの単語と混合されますか?
ありがとう!
解決
- すべての検索クエリを単一の単語の配列に分割します。
- 単語間の距離を計算します(より近いほど、より良い== gt;より高い値)
- すべてのクエリの各単語ペアにこの単語の距離を追加します。
より高い値を持つ単語ペアは、「トレンドタグ」です。
他のヒント
このcodeplexプロジェクトをご覧ください
http://www.codeplex.com/TheTagCloud
入力としてhtmlファイルを渡すことができ、タグクラウドを返す関数が含まれています。
所属していません StackOverflow