문제

의 첫 번째 부분은 이 질문은 이제 그 자체로 여기: 분석에 대한 텍스트 중심

질문: 수있는 방법 중심에 추가될 생성되는 말입니까?

내가 가지고 올:

내가 의미하지 않는 다만 악센트 기호,또는 변곡,또는 아무것도 단수와 같습니다.나는 뭔가 의미 같은 영국 전체에 악센트,또는 스코틀랜드의 악센트,또는 러시아,등등.

나는 생각이 할 수 있는 외부의 언어뿐만 아니라. Ex:가 러시아에서 생성할 수 있으로 영국 악센트,또는에서 뭔가를 만다린 수 있는 러시아의 악센트입니다.

나는 생각 기본적인 프로세스가 이:

  1. 텍스트 분석
    • 과 비교하는 데이터베이스(또는)확인 필요가 무엇인 악센트,그것이 얼마나 강한어야 합니다,등등.
  2. 를 생성하는 연설에서 지정한 언어
    • 을 쉽게 일반 텍스트-음성 변환 프로세서를 지원합니다.
  3. 결정은 지정된 악센트를 기반으로 분석한 텍스트입니다.
    • 이것은 부분에서 질문입니다.
    • 나는 생각 배열의 진폭 및 필터가 다음에 대한 최고의 작품을 단계입니다.
  4. 음성 메시고 악센트입니다.
    • 이 것은 쉬운 부분이다.
    • 그것은 아마에 의해 수행을 곱하여 악센트,다음과 같은 다른 많은 DSP 방법 않습니다.

이것은 정말 이상의 일반적인 DSP 질문,하지만 나와 함께 올 programatic 알고리즘을 대신 이의 일반적인 아이디어.

도움이 되었습니까?

해결책

는 무엇입니다.

악센트지 않은 소리를 필터링할그것은 패턴의 어쿠스틱 실현의 텍스트에서는 언어입니다.당신이 걸릴 수 없는 기록의 미국영어를 통해 실행"배열의 진폭 및 필터"가 영국 영어 있습니다.What DSP 유용한 구현에 운율, 지 않는,악센트입니다.

기본적으로(그리고 가장 간단한 모델),센트로 구성되어 있에 대한 규칙의 음성의 실현을 시퀀스의깊게 살펴보시길 바랍니다.의 인식센트 더 영향을 받 의 운율 고있는 음소 스피커를 선택할 때 읽기 텍스트입니다.

음 generation

프로세스의 음성을 세대는 두 개의 기본 단계:

  1. 텍스트-음소:변환 쓰는 텍스트 시퀀스의 음소(플러스 suprasegmentals 같은 스트레스 및 운율 정보를 말한 경계).이는 다소 억양에 따라 다릅니다(예:출력"에 대한 실험실에"다릅니다 사이에 미국과 영국의 스피커).

  2. 음-to-speech:주어진 순서 음소의 생성이 오디오에 따라 방언 규정에 대한 발음 깨달음의깊게 살펴보시길 바랍니다.(일반적으로 다음을 결합 diphones 을 조정하는 청각적으로의 운율).이것은 매우 악센트를 따라,그리고 이 단계 부여하는 기본 품질의데이트합니다.특정 음소는 경우에도 공유 사이에 두 개의 중심있을 수 있습니다,눈에 띄게 다른 어쿠스틱 실현.

일반적으로 이러한되어 있을 수 있습니다하는 동안 당신 는 영국인 악센트 음성기 발전기를 사용하는 미국 발음하는 것 이상한 소리.

성 연설과 함께 주어진 악센트

쓰기 텍스트-음성 프로그램의 엄청난 양이 작업(특히,구현하는 하나는 일반적 방식을,당신은 기록하는 원어민이 말하는 각각의 가능한 diphone 에 language),그래서 당신은 더 나을 것을 사용하여 기존 하나입니다.

에서 짧은,당신은 영국인 악센트,사용하는 영어 텍스트-음소 엔진과 함께는 영국식 영어 음소를 음성 엔진입니다.

에 대한 일반적인 중앙처럼 미국 및 영국식 영어,표준 중국어,메트로폴리탄,프랑스어,etc., 가 될 것입니다 몇 가지 선택을 포함,오픈 소스 사람은 당신을 수정할 수 있습니다(아래).예를 들어, FreeTTSeSpeak.에 대한 적은 일반적인 악센트,기존의 엔진에도 존재하지 않을 수 있습니다.

말하기 텍스트와 함께 외국인 악센트

영어로 외국-악센트가 사회적으로 매우 호므로,완전한 시스템 아마도 존재하지 않습니다.

하나의 전략을 결합하는 것입니다 off-the-shelf 텍스트-음소에 대한 엔진의 네이티브 악센트로 음소를 음성 엔진에 대한 외국어로 표기한다.예를 들어,한국어 러시아 스피커는 영어를 배우고 미국에서것 그럴듯하게 사용하여 미국 발음이 같은 단어의 실험, 고,지도 해당 음운에 자신의 기본 러시아어 음소,발음으로 그들을 러시아에 있습니다.(고 있다고 생각하는 웹사이트 이에 대한 영어와 일본이지만,없어요 링크가 있습니다.)

문제는 결과가 너무 극단적이다.진정한 영어 학습을 인식하고 생성하는 음소에 존재하지 않는 자신의 모국어,며 또한 변경은 그의 실현의 자신의 기본 음소를 대략적인 기본다.하는 정밀한 결과와 일치하는 원어민의 물론 다양하지만,를 사용하여 순수한 외국 극한의 말도 안되는 소리(주로 이해할 수 없는).

그래서를 생성하는 그럴듯한 미국인-한국어와-러시아-악센트(예를 들어),에 따라 달라질 수 있 쓰기 텍스트-음소 엔진입니다.당신이 사용할 수 있는 기존 미국 영어 러시아어 텍스트-음소 엔진하는 것으로 시작합니다.는 경우 당신이 기꺼이 찾아 기록하는 등 스피커,당신은 아마도 여전히 괜찮은 근사치 DSP 사용하여 결합하는 샘플에서 그 두 가지 엔진이 있습니다.에 대한 eSpeak 사용하여 포먼트 합성보다 기록된 샘플을 수도 있습니다 그래서 쉽게 결합하는 정보에서 다양한 언어로 제공합니다.

다른 것은 고려하는 외국의 스피커는 자주 수정하는 순서 음소의 영향 아래에 phonotactics 그들의 언어는,일반적으로 단순화하여 자음,클러스터를 삽입하 epenthetic 음,또는 diphthongizing 또는 파괴 모음습니다.

거기에 몇 가지 문학이 주제입니다.

다른 팁

이 질문은 실제로 "프로그래밍"되지 않습니다. 언어학입니다. 프로그래밍은 비교적 쉽습니다. 분석을 위해, 그것은 정말로 어려울 것이며, 진실로 사용자가 악센트를 지정하는 것이 더 좋을 것입니다. 아니면 자동화 된 스토리 리더를 위해 가고 있습니까?

그러나 기본적인 악센트는 현대 텍스트에서 음성으로 사용 가능합니다. 국제적인 발음 알파벳을 알고 있습니까? http://en.wikipedia.org/wiki/international_phonetic_alphabet 기본적으로 인간의 목소리가 가능하게 만들 수있는 모든 소리를 나열합니다. 악센트는 알파벳에서 자체로 매핑 (함수)입니다. 예를 들어, 미국의 악센트가 영국인에게 미국의 악센트를 사귀려면 (영국인에게 영국인에게 영국을 들리게하는 것으로 충분하지는 않지만) 한 단어의 중간에있는 모든 "r"소리를 드릴 수 있습니다. 그래서 예를 들어, 폐포 트릴은 유성음의 융통적 인 융통으로 대체 될 것입니다. (이 모퉁이의 많은 경우이 작업을 위해 운동을 할 수 있습니다).

길고 짧은 : 쉽지 않은 이유는 아마도 아무도 그것을하지 않았을 것입니다. 나는 그들의 불가능한 말을 할 것입니다. 그러나 그것이 언어학 교수가하는 일입니다. 그러나 기본적 으로이 문제가있는 방위를 만들기 위해 악센트와 발음에 대해 몇 가지 두꺼운 교과서를 읽어야합니다. 행운을 빌어!

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top