機械学習の挑戦:英語の発音を学びます
-
21-08-2019 - |
質問
あなたはを入力し、その設定 CMUの発音データを取りたいと言いますこのようになります:
ABERRATION AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS AE2 B ER0 EY1 SH AH0 N Z
ABERT AE1 B ER0 T
ABET AH0 B EH1 T
ABETTED AH0 B EH1 T IH0 D
ABETTING AH0 B EH1 T IH0 NG
ABEX EY1 B EH0 K S
ABEYANCE AH0 B EY1 AH0 N S
(単語が左側にあり、右側には、をnoreferrer nofollowを ">キー)
そして、あなたは新しい単語を取ると、彼らは英語で発音されるだろうか推測する機械学習システムのためのトレーニングデータとして使用します。
これは、音素に可能なマップできた文字の固定トークンサイズがないので、少なくとも私にはそれほど明白ではありません。私はマルコフ連鎖とは何かが行くための正しい方法かもしれない気持ちを持っています。
どのようにあなたがこれを行うのでしょうか?
解決
問題が書記素 - 音素変換、自然言語処理のnoreferrer"> がのいくつかの論文が現れます。
他のヒント
未完全に私のフィールド、多分いくつかの層を持つニューラルネットワークの構築 - と音節の発音がを推測し、順次音節、後で層に単語の分割を推測するために、以前の層を
。ANFIS学習ニューラルネットワークを設定すると、タスクは間違いなくあるリテラル/発音データについて、数値データのための非常に簡単ですいくつかの注文より複雑ます。
所属していません StackOverflow