Recuperar dados artista da música da wikipedia? [fechadas]
-
19-08-2019 - |
Pergunta
Quando se trata de classificar músicas por gênero, eu encontrei wikipedia ter informações gênero mais interessante do que a maioria das outras fontes de dados.
Eu me lembro de um banco de dados que recolheu esse tipo de informação da Wikipedia e tornou mais fácil acesso, mas eu não poderia google nada até hoje.
Se eu estava a tentar recuperar esses dados, quais são as minhas opções? Existe algo parecido com o que eu descrevi ou que eu preciso para ir a-tela raspagem?
Solução 3
Eu encontrei o que eu estava pensando quando eu postei a minha pergunta. Infochimps mantém coleções de infoboxes de Wikipedia, tais como esta para artistas musicais. Não é realmente o que eu quero, porque embora ele só está disponível como um download.
Enquanto eu estava olhando, eu encontrei como artigos de acesso em formato XML com marcação wiki unrendered. Aparentemente é mais fácil nos servidores wikipedia mas não estou certo sobre se seria mais fácil de analisar.
Outras dicas
Você deve olhar para Freebase (ver, por exemplo, o artistas musical mesa ). Se você optar Wikipedia, então você provavelmente deve baixar um despejo de banco de dados .
Exemplo comparando listagens gênero de Freebase e Wikipedia para a banda Radiohead:
- Freebase : rock alternativo, rock arte, música eletrônica, rock progressivo, electro, e rocha experimental.
- Wikipedia :. Rock alternativo, eletrônico e rock experimental
Editar : Mais importante, eu incluí um exemplo de trabalho usando MJT, um quadro Javascript projetado para Freebase. Copie e cole isso em um arquivo, aberta com o seu navegador, digite o nome de um artista, e ver qual gêneros Freebase tem para eles.
Menos importante, eu mudei meus exemplos e padrão para Radiohead. =)
<html>
<head>
<script type="text/javascript" src="http://mjtemplate.org/dist/mjt-0.6/mjt.js"></script>
</head>
<body onload="mjt.run()">
<pre mjt.script="">
var name = mjt.urlquery.name ? mjt.urlquery.name : 'Radiohead';
</pre>
<div mjt.task="q">
mjt.freebase.MqlRead([{
type: '/music/artist',
name: {
value:name,
lang:{name:{value:'English'}}
},
genre: [{
name: {
value:null,
lang:{name:{value:'English'}}}
}]
}])
</div>
<form method="get" action="">
<input type="text" name="name" value="$name" />
<input type="submit" value="search" />
</form>
<table mjt.for="topic in q.result">
<tr mjt.for="(var rowi = 0; rowi < topic.genre.length; rowi++)">
<td><pre mjt.script="">var gname = topic.genre[rowi].name;</pre>$gname.value</td>
</tr>
</table>
</body></html>
Você está provavelmente usando outro idioma, mas espero que você pode facilmente traduzir a consulta acima.
MusicBrainz ( http://musicbrainz.org/ ) pode ser o que você quer, em vez de wikipedia. É um projeto para fazer um livremente licenciado coleção, de alta qualidade de metadados de música (nome do compositor, título do álbum, título da faixa, o nome do trombonista nessa faixa, etc.). Eles desenvolveram um banco de dados incrível, um esquema de banco de dados detalhado, diretrizes abrangentes de estilo para fazer, software aplicativo precisa e consistente de metadados que pode inserir metadados em tags em arquivos de dados de música, e uma API pelo qual você pode usar os dados. Todos livremente disponível e editado colaborativamente.
A única área fraca de metadados do MusicBrainz é gênero musical. Isto é porque seu um problema tão intratável:. "Funk" de uma pessoa é de outra pessoa "pop"