Domanda

Quali sono alcune librerie di machine learning C / c ++ che supportano il clustering di dati multidimensionali? (ad esempio K-Means)

Finora mi sono imbattuto

Sono tentato di lanciarmi da solo, ma sono sicuro che quelli preesistenti sono prestazioni di gran lunga migliori ottimizzate con più attenzione al codice.

È stato utile?

Soluzione

The Open Source C Clustering Library dal team di Human Genome presso il L'Università di Tokyo sembra promettente. Ha K-medie così come altri algoritmi di clustering gerarchici piatti. Scorri verso il basso nella loro pagina per la libreria vuota senza la GUI. Il progetto Wikipedia-Clustering sembra carino e un po 'più leggero. Ecco una biblioteca specializzata K-points dell'Università del Mariland . Ti suggerisco di esaminare questi considerando il tipo di dati. La preelaborazione dei dati per la creazione di vettori di funzionalità può essere impegnativa.

Altri suggerimenti

Non sono sicuro che tu stia cercando algoritmi come C4.5, ID3 ecc. oppure no. In tal caso, è possibile scaricare le singole fonti dai siti Web universitari in cui sono ricercate attivamente.

Esempio: C4.5 La fonte è disponibile all'indirizzo sito web di Quinlan .

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top