データセットを切り替えることができるランダムフォレストアルゴリズムの研究
-
16-10-2019 - |
質問
単一のアルゴリズムが複数の異なるデータセットのパターンを見つけて作業できるように、監視なしと監視された学習を監督した学習と組み合わせたランダムな森林に研究が行われたかどうかに興味があります。私はこれに関する研究を見つけるためにあらゆる方法をグーグルで検索し、空っぽになりました。誰かが私を正しい方向に向けることができますか?
解決
半教師の学習
監視されていない学習と監督された学習の組み合わせは、 semi-supervised learning
, 、これはあなたが探していると思う概念です。
Label propagation
ヒューリスティックを概説するときにしばしば引用されます semi-supervised learning
. 。本質は、クラスタリングを使用することですが、クラスターのラベルを導き出す(または提案)するために、既知のケースの小さなセットを使用することです。したがって、ラベル付きケースの小さなセットを使用して、はるかに大きな監視されていないデータのセットを分類できます。
ここにいくつかの参照があります:
- ウィキペディアにはエントリがあります
semi-supervised learning
. - Scikit Learnユーザーガイドは、多くの場合便利な出発点であり、ラベルプロポジーションルーチンを持っています.
- 実際、扱う論文があります
semi-supervised
random forest
モデル. - ここにもう1つ
お役に立てれば!
所属していません datascience.stackexchange