質問

多次元データのクラスタリングをサポートするC / c ++ Machine Learningライブラリとは何ですか? (たとえば、K-Means)

これまでに出くわした

私は自分でロールバックしたいと思っていますが、既存のものはコードに注目して最適化されたパフォーマンスがはるかに優れていると確信しています。

役に立ちましたか?

解決

The Human GenomeチームのオープンソースCクラスタリングライブラリ東京大学は有望に見えます。 K-meansと他のフラットな階層クラスタリングアルゴリズムがあります。 GUIなしでベアライブラリのページを下にスクロールします。 Wikipedia-Clusteringプロジェクトは素晴らしく、少し軽いようです。 ここには、マリランド大学の専門的なK-meansライブラリがあります。 データの種類を考慮してこれらを確認することをお勧めします。データを前処理して特徴ベクトルを作成するのは難しいかもしれません。

他のヒント

C4.5、ID3などのアルゴリズムを探しているかどうかはわかりません。その場合、大学のWebサイトから個々のソースをダウンロードして、活発に研究しています。

例:C4.5ソースは、 QuinlanのWebサイトにあります。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top