Domanda

In un follow-up a questa risposta voglio chiedere se Qualcuno di voi sa nulla di buono (e più importante di facile comprensione ) tutorial e / o esempi di data mining con il Weka toolkit .

Sono stato molto interessato a Data Mining mai da quando ho sentito parlare di esso e le cose che può fare, ho hanno anche alcuni esperimenti che mi piacerebbe fare con alcuni dei miei dati e ho già acquistato quattro libri e ho trovato particolarmente interessante le due seguenti:

Analisi dei dati intelligente Data Mining http://ecx.images-amazon.com/images/I/61DhYb1Z6QL. _BO2,204,203,200_PIsitb-sticker-freccia-click, Discutiamone, 35, -76_AA240_SH20_OU01_.jpg

L'ultimo è stato scritto dagli stessi autori di Weka e contiene un sacco di esempi, ma ancora, ho trovato un po 'difficile da capire la logica e soprattutto la matematica. Le mie abilità matematiche sono attualmente molto agitato, ho intenzione di andare all'Università quest'anno e spero di imparare ed essere in grado di capire meglio la matematica coinvolta, ma fino ad allora voglio guadagnare una certa pratica in Data Mining.

C'è qualche tutorial step-by-step, con i dati di esempio posso leggere per ottenerlo iniziato con il toolkit Weka?

È stato utile?

Soluzione

Quando si tratta di "applicata" data mining, per gli antipasti, potrebbe non essere necessario pensare a matematica a tutti. Weka è frutto di un progetto di apprendimento automatico universitario e offre più di 100 algoritmi . Contrasto che con Microsoft SSAS SQL server che offre nove algoritmi -. e non si preoccupano neppure di spiegare la matematica

Entrambi associazione offerta, il clustering, attribuiscono la selezione, una sorta di rete neurale. Così, il trucco è quello di capire che cosa si sta cercando di ottenere, non necessariamente la matematica sottostante. Prova a leggere su algoritmi Microsoft (buona documentazione) e vedere se si riesce a capire i principi che SSAS e Weka hanno in comune - questo dovrebbe aiutare a concentrarsi sui principi di base e iniziare.

C'è una lista di alcuni Weka tutorial qui .

Altri suggerimenti

Personalmente, vorrei utilizzare RapidMiner5, in quanto è un ambiente GUI super facile (molto meglio di v4). Ha tutte le funzioni disponibili WEKA.

Get RapidMiner qui: http://www.rapid-i.com

Super Video facile intro di RapidMiner qui:

https://dspace.ndlr.ie/jspui/handle/10633/2353

qui:

http://www.neuralmarkettrends.com/

e qui:

http://www.youtube.com/user/VancouverData

Se vuoi saperne di più sulle statistiche dietro data mining, vedere serie di conferenze di questa Standford prof a Google:

http://www.youtube.com/watch?v=zRsMEl6PHhM&feature=related

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top