Frage

In einem Follow-up zu dieser Antwort ich fragen, ob jeder wissen Sie eine gute (und was noch wichtiger ist leicht zu verstehen ) Tutorials und / oder Beispiele für Data Mining mit der Weka-Toolkit .

Ich habe immer in Data Mining sehr interessiert, da ich zum ersten Mal davon gehört habe und die Dinge, die sie tun können, ich habe auch einige Experimente haben möchte mich mit einigen meiner Daten zu tun und ich habe bereits gekauft vier Bücher und ich fand besonders die folgenden zwei interessant:

Data Mining http://ecx.images-amazon.com/images/I/61DhYb1Z6QL. _BO2,204,203,200_PIsitb-Aufkleber-Pfeil-Klick, TopRight, 35, -76_AA240_SH20_OU01_.jpg

Der letzte ist von den gleichen Autoren von Weka geschrieben und viele Beispiele enthält aber immer noch, ich fand es ein wenig schwer, die Logik und speziell die Mathematik zu verstehen. Meine mathematischen Fähigkeiten sind derzeit sehr rau, ich plane in diesem Jahr an die Universität gehen und hoffentlich werde ich lernen und in der Lage sein, besser die Mathematik zu verstehen beteiligt, aber bis dahin möchte ich einige Übung in Data Mining gewinnen.

Gibt es ein Schritt-für-Schritt-Tutorial mit Beispieldaten wir lesen kann mich mit dem Weka-Toolkit zu erhalten begonnen?

War es hilfreich?

Lösung

Wenn es um die Data-Mining „angewendet“, für die Starter, können Sie überhaupt nicht über Mathematik zu denken. Weka ist Produkt einer Universität Maschine-Learning-Projekt und Angebote 100+ Algorithmen . Kontrast, dass mit Microsoft SQL Server SSAS die Angebote neun Algorithmen -. und sie nicht einmal die Mühe, die Mathematik zu erklären

Sie bieten beide Assoziation, Clustering, Attributauswahl, eine Art neuronales Netz. So ist der Trick, um zu verstehen, was Sie versuchen zu erreichen, die nicht unbedingt die Mathematik unten. Versuchen Sie das Lesen über Microsoft-Algorithmen (gute Dokumentation) und sehen, ob Sie Prinzipien herausfinden können, dass SSAS und Weka gemeinsam haben - dies sollte Ihnen helfen, auf Grundprinzipien konzentrieren und Ihnen den Einstieg.

Es gibt eine Liste von ein paar Weka Tutorials hier .

Andere Tipps

Ich persönlich würde RapidMiner5 verwenden, da es eine super einfach GUI-Umgebung ist (viel besser als v4). Es hat all die WEKA-Funktionen zur Verfügung.

Get Rapidminer hier: http://www.rapid-i.com

Super leicht Intro-Videos Rapidminer hier:

https://dspace.ndlr.ie/jspui/handle/10633/2353

hier:

http://www.neuralmarkettrends.com/

und hier:

http://www.youtube.com/user/VancouverData

Wenn Sie mehr über die Statistiken hinter Data Mining erfahren möchten, finden Sie in diesem Vortragsreihe der Standford prof bei Google:

http://www.youtube.com/watch?v=zRsMEl6PHhM&feature=related

Hier sind Links zu einer Sammlung von Videos und ein Sammlung von Tutorials .

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top