문제

내 프로젝트에서는 lium_spkdiarization-4.7.jar라는 라이브러리를 사용하고 있지만 어떻게 작동합니까?누구든지, 조금 설명 할 수 있습니까?

또한 파이썬으로 사용하고 있습니다.

라이브러리에 대한 링크는 다음과 같습니다. https : //voiceid.googlecode.com/svn-history/r11/trunk/scripts/lium_spkdiarization-4.7.jar

미리 감사드립니다.

도움이 되었습니까?

해결책

이 도구를 알지 못했습니다. 그것은 정말로 멋지게 보입니다. 위키를 확인 했습니까? 그들은 시스템이 작동하는 방식에 대한 논문이 있습니다. http://lium3.univ-lemans.fr / kiarization/doku.php

기본적으로, 그들은 MFCC 멜 주파수 Cepstrum 계수 (표준 기술)를 계산합니다. 이것은 기본 단계입니다. 그것은 작업 할 수있는 기능 공간을 생성합니다. 슬라이딩 창 위로 FFT를 계산하는 것과 유사합니다. 궁극적으로 클러스터링은 BACESIAN 정보 기준 (BIC) 방법을 사용하여 이러한 시간 슬라이스 기능에 대해 수행됩니다. 먼저 시간 기반 기능 공간을 세그리밍 한 다음 클러스터로 연결하고 각 스피커의 일관된 기능을 찾습니다. HMM, 비터 비, EM 및 때로는 GMM을 사용할 수 있습니다.

나는 그것을 자세히 설명하기에 충분할 정도로 알고리즘을 모른다. 그러나 이것은 http://lium3.univ-lemans.fr/diarization/doku.php/overize/doku.php/overization/a>

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top