Pergunta

Em um acompanhamento desta resposta Quero perguntar se algum de vocês conhece algum bem (e mais importante fácil de entender) tutoriais e / ou exemplos de mineração de dados com o Weka Toolkit.

Estou muito interessado em mineração de dados desde que ouvi falar disso e as coisas que pode fazer, também tenho alguns experimentos que gostaria de fazer com alguns dos meus dados e já comprei quatro Livros e eu achamos especialmente interessante nos dois seguintes:

Intelligent Data Analysis Mineração de dados http://ecx.images-amazon.com/images/i/61dhyb1z6ql._bo2,204,203,200_pisitb sTicker-arrow-click.toprrigh, 35,-76_AA240_SH20_OU01_.JPG

O último é escrito pelos mesmos autores de Weka e contém muitos exemplos, mas ainda assim achei um pouco difícil entender a lógica e, especialmente, a matemática. Atualmente, minhas habilidades matemáticas são muito difíceis, pretendo ir à universidade este ano e espero aprender e conseguir entender melhor a matemática envolvida, mas até então quero obter alguma prática na mineração de dados.

Existe algum tutorial passo a passo com dados de exemplo que eu possa ler para me iniciar com o Weka Toolkit?

Foi útil?

Solução

Quando se trata de mineração de dados "aplicada", para os iniciantes, talvez você não precise pensar em matemática. Weka é produto de um projeto de aprendizado de máquina da universidade e Oferece mais de 100 algoritmos. Contraste isso com a Microsoft SQL Server SSAS, que oferece nove Algoritmos - e eles nem se preocupam em explicar as contas.

Ambos oferecem associação, agrupamento, seleção de atributos, algum tipo de rede neural. Portanto, o truque é entender o que você está tentando alcançar, não necessariamente a matemática abaixo. Tente ler sobre os algoritmos da Microsoft (boa documentação) e veja se você pode descobrir os princípios que o SSAS e o Weka têm em comum - isso deve ajudá -lo a se concentrar nos princípios básicos e iniciar você.

Há uma lista de alguns weka tutoriais aqui.

Outras dicas

Pessoalmente, eu usaria o RapidMiner5, pois é um ambiente super fácil da GUI (muito melhor que a V4). Tem todas as funções Weka disponíveis.

Obtenha o RapidMiner aqui: http://www.rapid-i.com

Vídeos de introdução super fáceis para o RapidMiner aqui:

https://dspace.ndlr.ie/jspui/handle/10633/2353

aqui:

http://www.neuralmarkettrends.com/

e aqui:

http://www.youtube.com/user/vancouverdata

Se você quiser saber mais sobre as estatísticas por trás da mineração de dados, consulte esta série de palestras do Standford Prof no Google:

http://www.youtube.com/watch?v=zrsmel6phhm&feature=related

Aqui estão links para um coleção de vídeos e a Coleção de tutoriais.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top