Pergunta

Estou tentando usar o recurso SoX vad (detecção de atividade de voz) para analisar um arquivo wav e determinar se ele contém fala (sem surpresa). No entanto, estou usando-o na linha de comando em um servidor Linux que não possui dispositivo de áudio.Eu esperaria poder executar o comando e capturar a saída de alguma forma, mas parece que o recurso vad depende do uso do comando "play" e parece depender de um dispositivo de áudio.

Existe uma maneira de fazer isso sem um dispositivo de áudio?

Foi útil?

Solução

Funciona aqui, como você executou isso?Aqui está o que eu fiz:

sox infile.wav outfile.wav vad

outfile.wav é cortado na frente até que a voz seja detectada.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top