MapR dispone di algoritmi di machine learning scalabili.Come Mahout?
-
28-10-2019 - |
Domanda
Mi chiedo specificamente se MapR abbia il clustering di Kmeans proprio come Mahout?
Soluzione
Per quanto ne so, MapR è solo un Hadoop "più veloce". Non sono inclusi algoritmi.
Quindi i tuoi lavori dovrebbero essere compatibili.
Ma qual è il problema nell'implementare il tuo? K-means è semplicissimo. Vedi il mio post sul blog: http://codingwiththomas.blogspot.com/2011/05 /k-means-clustering-with-mapreduce.html
Tuttavia, ho implementato un clustering k-means con BSP (Bulk Synchronous Parallel) e Apache Hama che è quasi dieci volte più veloce se confrontato con i risultati del benchmark Mahout in questo libro: http://www.manning.com/ingersoll/ (linkato jira: https://issues.apache.org/jira/browse/MAHOUT-588 ) Ecco il benchmark di k-means con Apache Hama: http://wiki.apache.org/hama/Benchmarks
Puoi trovarlo qui: https://github.com/thomasjungblut /thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java