Pergunta

Quando se trata de classificar músicas por gênero, eu encontrei wikipedia ter informações gênero mais interessante do que a maioria das outras fontes de dados.

Eu me lembro de um banco de dados que recolheu esse tipo de informação da Wikipedia e tornou mais fácil acesso, mas eu não poderia google nada até hoje.

Se eu estava a tentar recuperar esses dados, quais são as minhas opções? Existe algo parecido com o que eu descrevi ou que eu preciso para ir a-tela raspagem?

Foi útil?

Solução 3

Eu encontrei o que eu estava pensando quando eu postei a minha pergunta. Infochimps mantém coleções de infoboxes de Wikipedia, tais como esta para artistas musicais. Não é realmente o que eu quero, porque embora ele só está disponível como um download.

Enquanto eu estava olhando, eu encontrei como artigos de acesso em formato XML com marcação wiki unrendered. Aparentemente é mais fácil nos servidores wikipedia mas não estou certo sobre se seria mais fácil de analisar.

Outras dicas

Você deve olhar para Freebase (ver, por exemplo, o artistas musical mesa ). Se você optar Wikipedia, então você provavelmente deve baixar um despejo de banco de dados .

Exemplo comparando listagens gênero de Freebase e Wikipedia para a banda Radiohead:

  • Freebase : rock alternativo, rock arte, música eletrônica, rock progressivo, electro, e rocha experimental.
  • Wikipedia :. Rock alternativo, eletrônico e rock experimental

Editar : Mais importante, eu incluí um exemplo de trabalho usando MJT, um quadro Javascript projetado para Freebase. Copie e cole isso em um arquivo, aberta com o seu navegador, digite o nome de um artista, e ver qual gêneros Freebase tem para eles.

Menos importante, eu mudei meus exemplos e padrão para Radiohead. =)

<html>
<head>
  <script type="text/javascript" src="http://mjtemplate.org/dist/mjt-0.6/mjt.js"></script>
</head>
<body onload="mjt.run()">
<pre mjt.script="">
var name = mjt.urlquery.name ? mjt.urlquery.name : 'Radiohead';
</pre>
<div mjt.task="q">
mjt.freebase.MqlRead([{
  type: '/music/artist',
  name: {
    value:name,
    lang:{name:{value:'English'}}
  },
  genre: [{
    name: {
      value:null,
      lang:{name:{value:'English'}}}
  }]
}])
</div>

<form method="get" action="">
<input type="text" name="name" value="$name" />
<input type="submit" value="search" />
</form>

<table mjt.for="topic in q.result">
  <tr mjt.for="(var rowi = 0; rowi &lt; topic.genre.length; rowi++)">
    <td><pre mjt.script="">var gname = topic.genre[rowi].name;</pre>$gname.value</td>
  </tr>
</table>
</body></html>

Você está provavelmente usando outro idioma, mas espero que você pode facilmente traduzir a consulta acima.

MusicBrainz ( http://musicbrainz.org/ ) pode ser o que você quer, em vez de wikipedia. É um projeto para fazer um livremente licenciado coleção, de alta qualidade de metadados de música (nome do compositor, título do álbum, título da faixa, o nome do trombonista nessa faixa, etc.). Eles desenvolveram um banco de dados incrível, um esquema de banco de dados detalhado, diretrizes abrangentes de estilo para fazer, software aplicativo precisa e consistente de metadados que pode inserir metadados em tags em arquivos de dados de música, e uma API pelo qual você pode usar os dados. Todos livremente disponível e editado colaborativamente.

A única área fraca de metadados do MusicBrainz é gênero musical. Isto é porque seu um problema tão intratável:. "Funk" de uma pessoa é de outra pessoa "pop"

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top