質問

私はLuceneによって索引付けされ、ユーザーのタグとMahoutによって分類される記事のデータベースを持っています。記事にはタグの特定のスコアがあります(ユーザーはタグに同意するか反対することができます、Mahoutによって発見されたタグはユーザーと同じ扱いを受けます)。

プロファイルと対話履歴からユーザーの興味を見つけたい(特定のタグに興味深い)。

ユーザーの興味を保存する方法は?
そして、検索結果をソートまたはフィルタするためにユーザーの興味を使用することができますか?

私のアプローチは可能ですか?実行可能な?スケーラブル?
私がどのような技術とアルゴリズムを使うことができるか?を提案してください!

役に立ちましたか?

解決

これは主に検索問題のようなものであり、推薦の問題ではありません。タグに基づく検索結果を主にソートおよびフィルタリングしています。そのため、Luceneは一般的に展開されていないツールであると思います。 (タグを学ぶためにMahout分類器を使用することはかなり正しいですが)

本当にこれを推奨問題として想像したい場合は、あなたのアイテムがタグであると言うかもしれません。タグと対話するときはいつでも、x、y、zを表示するように、それはあなたが「アイテム」x、y、zに少し関心があることを示しています。興味深い。

タグとの単純なインタラクションを数値「評価」として使用してみて、推奨コンテキストに大きな結果を与えないと思います。カウントのログを使用することは良いですが、それでも間違っていると感じています。インタラクションカウントを無視して、ユーザーとタグが対話したことがあるかどうかを使用してください。 - 「ブール環境設定」。

私が知っているこの入力に最も適した推薦アルゴリズムモデルは、ParalialAlsFactorizationJobで表示されている交互の最小二乗モデルです。それがあなたに使えるかどうかわかりませんが、それがあなたが時間と傾きがあるかどうかを調査するアルゴリズムです。その入力は、評価ではなく、そのように扱い、それがあなたがここに持っているものです。

他のヒント

多くの場合、ユーザーが彼らが興味を持っているタグを明示的に言うことが簡単です。これは、たとえばスタックオーバーフローが行うことです。タグが興味のあるものの場合は、ある金額でスコアを上げることができます。

あなたがより暗黙的に何かをしたいのなら、mahoutにはよくある質問推奨事項について

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top