Обработка сигнала для аудиофайла в Python

StackOverflow https://stackoverflow.com/questions/4752634

  •  13-10-2019
  •  | 
  •  

Вопрос

Я связываюсь с обнаружением молчания в несущественных аудиофайлах AIFF. Я предпочитаю делать это в Python, но рассмотрю другие варианты, если это очень неэффективно. Ожидается, что несомненные файлы, с которыми я имею дело, составляют 20 МБ (максимальный размер).

Я могу понять основы обработки сигналов, но не эксперт в ней.

Это было полезно?

Решение

Тебе повезло! А AIFC Библиотека, кажется, делает достаточно, чтобы поддержать решение вашей проблемы.

Другие советы

Языко-агрессивный псевдод:

  • Для каждого окна времени (например, 10 мс)
    • Рассчитайте среднеквадратичную мощность во временном окне
    • Silence = RMS Power <порог молчания

Для расчета среднеквадратичной мощности:

  • sum_sq = 0
  • Для каждого образца в окне образца N
    • sum_sq += образец^2
  • RMS Power = SQRT (SUM_SQ / N)

Вы, вероятно, также хотите добавить еще один слой обнаружения, например, решить, что Silence = M последовательные молчаливые окна, где M определяет, как долго должна быть молчание, прежде чем оно считается реальной тишиной.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top