문제

나는 Mel-Frequency Cepstrum 알고리즘을 만들고 싶지만 이해하지 못하는 것들이 있습니다.

FTT가 완료된 후 "삼각형 중첩 창을 사용하여 위에서 얻은 스펙트럼의 전력을 MEL 스케일에 매핑해야합니다."

삼각형을 계산하는 방법을 알고 있으며 Mel 스케일로 전달하는 방법도 알고 있습니다. 나는 단순히 그들과 무엇을 해야할지 모른다.

삼각형이 정의 된 경우 위에서 얻은 스펙트럼의 전력을 MEL 스케일에 어떻게 매핑합니까?

다음과 같습니다. 삼각형 내부의 주파수를 합계 한 다음 Mel 스케일로 전달합니까? 아니면 중량 값 (그 시점에서 삼각형의 높이에 의해 정의 됨)에 따라 삼각형 내부의 주파수를 합한 다음 Mel 스케일로 전달합니까? 아니면 weith 값에 따라 삼각형 내부의 모든 주파수를 Mel 스케일로 전달합니까? 또 다른 한가지?

누구든지 나에게 이것을 명확히 할 수 있습니까?

도움이 되었습니까?

해결책

나는이 과정 의이 단계가 조금 이상하고 (어쨌든 나에게) 완전히 의미가 없다고 생각합니다. 필터 밴드의 중심은 멜 스케일을 따라 똑같이 간격을두고 있지만 선형 스케일의 삼각형입니다. 즉, 그림과 같습니다. 여기.

그런 다음 선형 x 축을 따라이 삼각형을 사용하여 가중 합계를 계산하십시오. (이전 단계에서는 일부 접근 방식이 필터 삼각형 영역에 의해 정상화된다고 생각하며 일부는 그렇지 않으며, 일부는 여기서 최종 결과에 대해서는 확신하지 못하지만, 수정하는 것 외에는 그다지 의미가 없을 것 같지만 여기서 최종 결과는 확실하지 않습니다. 어쨌든 상대적으로 비교하는 최종 해석. 하나는 총 에너지를 유지하고 다른 하나는 대역당 똑같이 가중 기여를 제공합니다.) 그런 다음이 로그를 가져옵니다 (전체 볼륨 계수를 오프셋으로 변환).

편집하다:필터를 적용 할 때 더 명확하게하려면 ... 각 삼각형은 별도의 필터를 나타내며 별도의 가중 합계를 생성합니다. 필터 뱅크에 20 개의 필터가있는 경우 20 개의 삼각형과 20 개의 가중 합이 계산됩니다. 각 필터를 적용하려면 각 x 축에 대해 해당 x- 위치의 함수 값에 의해 해당 x- 위치의 필터 값을 여러 번, 해당 특정 필터의 합에 추가하십시오. 대부분의 X 축 값에는 두 개의 필터가 존재하는 필터가 있으므로 각 X-Location에서 두 개의 필터에 기여합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top