将英语单词分成对应于不同声音的字形

时间:2012-05-30 23:31:03

标签: text nlp character

如何将英文输入词转换为字素组合?是否有图书馆或功能来完成这项工作?

我正在寻找的是一种算法/实现,它将正交词分成映射到音素的段。也就是说,一个单词中的字母序列应该在不同的声音之间被打破。

在我看来,这看起来像下面这样:

physically --> ph-y-s-i-c-a-ll-y
psychology --> ps-y-ch-o-l-o-g-y
thrush -->     th-r-u-sh
bought --> b-ough-t
chew --> ch-ew
palm --> p-al-m

1 个答案:

答案 0 :(得分:1)

搜索split english words into graphemes,第一个结果似乎是一篇关于使用机器学习方法将英语拼写法映射到音素表示的论文。 This paper似乎正在做你正在寻找的事情。