Pergunta

Eu sou novo para o mundo de áudio, e tenho sido atribuída uma tarefa que eu não tenho certeza de como lidar com eles. Eu preciso para exibir um gráfico representando a afinação de um arquivo WAV. O arquivo WAV pode ser polifônico, e então eu preciso para exibir o gráfico tom da dominante (leia-se: com o mais forte volume) instrumento (ou cantando voz humana). Estou bastante familiarizado com .NET e sabe quase nada em C, C ++, Java.

Eu comecei uma pesquisa na web, e pelo que entendi detecção de tom de arquivos WAV polifônicos é um não resolvido problema, mas eu não preciso do tom exato, apenas para saber se é mais elevado do próximo, e o que é o seu comprimento.

As minhas perguntas são:

  1. Onde devo começar para aprender a teoria por trás dessa tarefa? Existem quaisquer livros recomendados para isso?

  2. Existe alguma API / ferramenta que pode fazer isso?

Obrigado,

ML

Foi útil?

Solução

Você pode usar análise de Fourier para extrair as frequências constituintes da onda. Aqui está uma pergunta SO relacionada: Rápida de Fourier Transform em C #

Outras dicas

Eu comecei em sinal de processamento com Digital Signal Processing . Você pode comprar o livro impresso por cerca de US $ 30, ou fazer o download do pdf para livre. Foi escrito para não-cientistas, e contém uma grande quantidade de informações para chegar até você e correr com várias técnicas de processamento de sinal.

FFT (Fast Fourier transforma) irá converter um tempo vs amplitude do sinal em uma freqüência (caixas) vs a intensidade (energia). Você pode ir de frequência a uma nota via gráficos padrão encontrados em um monte de sites.

Eu tenho trabalhado em um projeto algo relacionado. Você vai querer investigar Transformada rápida de Fourier. Posso recomendar este href="http://www.codeproject.com/KB/audio-video/FftGuitarTuner.aspx" projeto escrito em C # - é escrito como uma guitarra sintonizador mas pode ser facilmente modificado para o seu propósito.

Este, porém, não vai fazer multi-campo. Existe um produto chamado " CELEMONY " que alega ter essa capacidade usando "Acesso Nota direto (DNA )". Sua tecnologia é fonte compreensivelmente fechado, mas você pode ser capaz de licenciá-lo a um preço justo.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top