机器学习挑战:学习英语发音

时间:2009-03-23 14:39:37

标签: machine-learning phonetics

假设您想要获取如下所示的CMU's phonetic data set输入:

ABERRATION  AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL  AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS  AE2 B ER0 EY1 SH AH0 N Z
ABERT  AE1 B ER0 T
ABET  AH0 B EH1 T
ABETTED  AH0 B EH1 T IH0 D
ABETTING  AH0 B EH1 T IH0 NG
ABEX  EY1 B EH0 K S
ABEYANCE  AH0 B EY1 AH0 N S

(单词在左侧,右侧是一系列音素,key here

并且您希望将其用作机器学习系统的训练数据,该系统将采用新词并猜测它们将如何用英语发音。

至少对我来说不是那么明显,因为没有固定的令牌大小的字母可以映射到音素。我觉得与马尔可夫链有关可能是正确的方法。

你会怎么做?

2 个答案:

答案 0 :(得分:4)

问题称为Grapheme-to-phoneme转换,是Natural Language Processing的子问题。 Google brings up一些论文。

答案 1 :(得分:2)

不完全是我的领域,但可能构建一个具有多个层的神经网络 - 较早的层来猜测将单词拆分为顺序音节,后面的层来猜测所述音节的发音。

建立一个ANFIS学习神经网络对于数值数据来说相当简单,对于文字/语音数据来说,任务无疑是几个更复杂的命令。