Domanda

Mi chiedo specificamente se MapR abbia il clustering di Kmeans proprio come Mahout?

È stato utile?

Soluzione

Per quanto ne so, MapR è solo un Hadoop "più veloce". Non sono inclusi algoritmi.

Quindi i tuoi lavori dovrebbero essere compatibili.

Ma qual è il problema nell'implementare il tuo? K-means è semplicissimo. Vedi il mio post sul blog: http://codingwiththomas.blogspot.com/2011/05 /k-means-clustering-with-mapreduce.html

Tuttavia, ho implementato un clustering k-means con BSP (Bulk Synchronous Parallel) e Apache Hama che è quasi dieci volte più veloce se confrontato con i risultati del benchmark Mahout in questo libro: http://www.manning.com/ingersoll/ (linkato jira: https://issues.apache.org/jira/browse/MAHOUT-588 ) Ecco il benchmark di k-means con Apache Hama: http://wiki.apache.org/hama/Benchmarks

Puoi trovarlo qui: https://github.com/thomasjungblut /thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top