题
我正在与未压缩的AIFF音频文件中进行沉默检测。我更喜欢在Python中这样做,但是如果这是超级效率的,则考虑其他选择。我要处理的未压缩文件预计为20 MB(最大尺寸)。
我可以理解信号处理的基础知识,但不是其中的专家。
解决方案
你很幸运!这 AIFC 图书馆似乎足以支持解决问题的解决。
其他提示
语言不合时宜的伪代码:
- 对于每个时间窗口(例如10毫秒)
- 计算时间窗口中的RMS功率
- 沉默= RMS功率<沉默阈值
计算RMS功率:
- sum_sq = 0
- 对于n个样品窗口中的每个样品
- sum_sq +=示例^2
- rms power = sqrt(sum_sq / n)
您可能还想添加进一步的检测层,例如确定寂静=连续的无声窗口,其中m确定寂静需要多长时间才能将其视为实际的沉默。
不隶属于 StackOverflow