문제

현재 기술의 모든 음성-텍스트 알고리즘이 실시간으로 작동합니까? 나는 마이크가있는 컴퓨터에 앉아있는 사람이 아니라 사전 녹음 된 오디오 파일을 입력하는 것을 의미하지는 않습니다.

즉, 30 분 음성 녹음이 있다면 항상 30 분이 걸리나요?

거기에 다른 접근법이 있습니까?

도움이 되었습니까?

해결책

음성 인식이 오디오 길이를 수행하는 한 오랫동안 걸리는 이유는 없습니다. 그러나 필요한 계산으로 인해 실시간 알고리즘보다 크게 빠르지 않을 것이라고 생각하지 않습니다. 보다 이번 장 보다 자세한 정보는 Wikipedia 기사 중에서 (성능에 대한 괜찮은 개요를 제공하지만 시간을주지 않는 것 같습니다).

다른 팁

알고리즘을 실시간보다 빠르게 실행하는 것은 없습니다. 자연스럽게 말하면 10 전문 소프트웨어 프로그램은 컴퓨터에서 벗어나면서 취한 받아 들여지는 "파일 전사"옵션을 제공합니다. 이는 실행중인 컴퓨터가 달성 할 수있는만큼 빠르게 작동합니다.

나는 배치 처리 구현이 신호 인텔리전스 영역에 존재한다고 생각하지만 그러한 프로그램은 당연히 일반 대중에게는 사용할 수 없을 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top