Vale la pena di acquisto Mahout in azione per arrivare fino a velocità con Mahout, o ci sono altre fonti migliori?

StackOverflow https://stackoverflow.com/questions/4510471

  •  12-10-2019
  •  | 
  •  

Domanda

Al momento sono un utente molto casual di Apache Mahout , e sto pensando di acquistare il libro Mahout in azione . Purtroppo, sto avendo un momento davvero difficile farsi un'idea di come vale la pena questo libro è - e visto che si tratta di un Manning Early Access Program libro (e quindi solo attualmente disponibile come e-book versione beta), non posso non dare un'occhiata me stesso in una libreria.

Qualcuno può raccomandare questo come un buon (o meno buona) guida per ottenere fino a velocità con Mahout, e / o di altre fonti che possono integrare il sito come Conduttore?

È stato utile?

Soluzione

Parlando come committer Mahout e co-autore del libro, penso che ne vale la pena. ; -)

Ma seriamente, che cosa stai lavorando? Forse possiamo puntare ad alcune risorse.

Alcuni aspetti di Mahout sono semplicemente difficile capire da soli. Lavoriamo sodo per rispondere alle domande sulla mailing list, ma può davvero aiutare ad avere il codice di esempio e una tabella di marcia. Senza alcuno di quello, è difficile chiedere anche una buona domanda.

Altri suggerimenti

Anche un co-autore qui. Essere "dalla bocca del cavallo" è probabilmente di gran lunga il più completo write-up là fuori per Mahout sé. Ci sono alcuni post buon blog là fuori, e sicuramente un sacco di buoni libri su apprendimento automatico, più in generale (mi piace Collective Intelligence in azione come una vasta intro luce). user@mahout.apache.org ha poche persone che dicono come il libro FWIW, così come i forum del libro (http://www.manning-sandbox.com/forum.jspa?forumID=623) penso che si può tornare l'e-book, se non è proprio quello che si voleva. E 'sicuramente 6 capitoli sul clustering.

ci sono molte parti del libro che non sono aggiornati, una versione o due dietro ciò che è in corso. In aggiunta, ci sono alcuni errori nel testo, in particolare all'interno degli esempi. questo può rendere le cose un po 'difficile quando si cerca di replicare i risultati discussi.

Inoltre, si dovrebbe essere consapevoli del fatto che la maggior parte di maturare mahout, il sistema di raccomandazione, il gusto, isnt distribuito. Io non sono davvero sicuro perché questo è confezionato con il resto del mahout. questo è più una denuncia circa il pacchetto software di mahout stesso.

Al momento il migliore in circolazione. Probabilmente maturare come il prodotto. Alcuni aspetti sono migliori di altri, spaccato l'implementazione sottostante è buono, metodi pratici per ottenere installato e funzionante su Linux, Mac OSX, ecc per i principianti non tanto. Definizione di una chiara strategia su come mantenere un recommender aggiornata è incerto. esempi di produzione piuttosto sottile. Buono come un punto di partenza, ma è necessario molto di più. Gli autori fanno meglio tentativo di aiuto, ma è un nuovo prodotto abbastanza. Tutto sommato, sì, acquistarlo.

ho ricevuto il libro un paio di settimane fa. Altamente raccomandato. Gli autori sono molto attivi sulla mailing list, troppo, e c'è un sacco di energia fresca in questo progetto.

Si potrebbe anche prendere in considerazione la lettura attraverso Enterprise Data flussi di lavoro di Paco Nathan in cascata. È possibile eseguire PMML nel cluster esportati da R o SAS. Questo non vuol dire nulla di male su Mahout in azione, gli autori hanno fatto un ottimo lavoro e chiaramente mettono buon tempo e lo sforzo nel rendere istruttivo e interessante. Questo è più di un suggerimento di guardare oltre Mahout. Al momento non è sempre il tipo di trazione che sarebbe se fosse più facile da usare.

Allo stato attuale, l'esperienza dell'utente Mahout è un pò mosso, e in realtà non vi darà una chiara idea di come sviluppare e aggiornare i sistemi intelligenti e dei loro cicli di vita, IMO. Mahout non è davvero accettabile per gli accademici sia, sono più propensi a usare Matlab o R. Nei documenti Mahout, l'attuazione foresta casuale funziona a malapena e la documentazione sono esempi errati, ecc ... Questo è frustrante, e il parallelismo e la scalabilità di le routine Mahout dipendono l'algoritmo. Io attualmente non vedo come Conduttore va da nessuna parte solida così com'è, di nuovo IMO. Spero che mi sbaglio!

http://shop.oreilly.com/product/0636920028536.do

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top