Pregunta

Me preguntaba si alguien me podría apuntar a un buen tutorial o me muestran cómo representar gráficamente la amplitud de una matriz de bytes. El formato de audio que estoy usando es:. T LEY 8000.0 Hz, 8 bits, mono, 1 bytes / marco

¿Fue útil?

Solución

Parece que usted está interesado en un corto plazo RMS suavizadas medición de amplitud. Por lo general, para ello se toma una versión rectificada de la señal de entrada, y luego aplica un filtro de paso bajo para esto, por ejemplo.

x1 = abs(x); // x2 = rectified input signal
x2 = k * x2 + (1 - k) * x1; // simple single pole low pass recursive filter

x2 es la amplitud de la señal x. k es un factor de <1,0 que determina la constante de tiempo del filtro de suavizado.

A continuación, tendrá algún tipo de valor umbral que se utiliza para decidir si usted está en silencio (x2 < threshold) o del habla (x2 >= threshold).

Otros consejos

transformada de Fourier . Pero es sólo una parte de todo lo que tiene que ver con el fin de lograr lo que desea.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top