我正在与未压缩的AIFF音频文件中进行沉默检测。我更喜欢在Python中这样做,但是如果这是超级效率的,则考虑其他选择。我要处理的未压缩文件预计为20 MB(最大尺寸)。

我可以理解信号处理的基础知识,但不是其中的专家。

有帮助吗?

解决方案

你很幸运!这 AIFC 图书馆似乎足以支持解决问题的解决。

其他提示

语言不合时宜的伪代码:

  • 对于每个时间窗口(例如10毫秒)
    • 计算时间窗口中的RMS功率
    • 沉默= RMS功率<沉默阈值

计算RMS功率:

  • sum_sq = 0
  • 对于n个样品窗口中的每个样品
    • sum_sq +=示例^2
  • rms power = sqrt(sum_sq / n)

您可能还想添加进一步的检测层,例如确定寂静=连续的无声窗口,其中m确定寂静需要多长时间才能将其视为实际的沉默。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top