機械学習の挑戦：英語の発音を学びます

https://stackoverflow.com/questions/673617

21-08-2019
|

質問

あなたはを入力し、その設定 CMUの発音データを取りたいと言いますこのようになります：

ABERRATION  AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL  AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS  AE2 B ER0 EY1 SH AH0 N Z
ABERT  AE1 B ER0 T
ABET  AH0 B EH1 T
ABETTED  AH0 B EH1 T IH0 D
ABETTING  AH0 B EH1 T IH0 NG
ABEX  EY1 B EH0 K S
ABEYANCE  AH0 B EY1 AH0 N S

（単語が左側にあり、右側には、をnoreferrer nofollowを ">キー）

そして、あなたは新しい単語を取ると、彼らは英語で発音されるだろうか推測する機械学習システムのためのトレーニングデータとして使用します。

これは、音素に可能なマップできた文字の固定トークンサイズがないので、少なくとも私にはそれほど明白ではありません。私はマルコフ連鎖とは何かが行くための正しい方法かもしれない気持ちを持っています。

どのようにあなたがこれを行うのでしょうか？

解決

問題が書記素 - 音素変換、自然言語処理のnoreferrer"> がのいくつかの論文が現れます。

他のヒント

未完全に私のフィールド、多分いくつかの層を持つニューラルネットワークの構築 - と音節の発音がを推測し、順次音節、後で層に単語の分割を推測するために、以前の層を

。 ANFIS学習ニューラルネットワークを設定すると、タスクは間違いなくあるリテラル/発音データについて、数値データのための非常に簡単ですいくつかの注文より複雑ます。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow