我正在尝试建立一个难以发音的英语单词集。
我想知道是否存在某种算法或理论,可以用来表示一个单词发音的难度。
这对您来说是否可以计算出来?
由于这似乎是一个非常主观的事情,让我说它更客观,让我们说用文本到语音技术发音最难的词。
答案 0 :(得分:3)
一种方法是构建一个包含每个单词的两个版本的列表。一个是正确的拼写,另一个是使用最简单的拼音拼写单词。在两个单词上应用距离函数(如Levenshtein距离http://en.wikipedia.org/wiki/Levenshtein_distance)。两个单词之间的距离越大,发音的单词就越难。
答案 1 :(得分:1)
很大的问题!在我的脑海中你可以创建一个系统,其中包含来自语音字母表的所有字母,并根据难度(每个组合基于难度(高度具体,因此可能需要多人测试和取平均值等)之间的连接权重)然后列出所有来自英语词典的单词存储在磁盘上并调用一个脚本,该脚本遍历每个条目并在维基百科上执行网络抓取以进行拼音拼写并对其难度进行排序。这可以考虑单词的长度以及加入语音之间的难度,然后根据难度对列表进行排序。
这就是我尝试并做:P
答案 2 :(得分:0)
在某种程度上......
例如,语音程序使用语音系统来尝试和发音。例如,“把握”将分为:
GR-A-SP
但是,对于外来词(或不遵循此模式的词),必须保留例外列表,例如游艇
答案 3 :(得分:0)
<强>建议强>
幸运的是,发音作为一个过程取决于两个因素,包括
/ A /,/ AE /,/ E /,/ I /,/ O /,/ U /,/ W /,/ J /...
第一个涉及电话声音制作的机制,因为必须改变手指声音,面颊舌头以产生与个别电话相关的各种声音,即鼻子等。这使得一些单词更难以发音,因为所需的运动可能是许多。请参阅有关语音的书籍,找到发音的位置。
<强>算法强>
a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/
祝你好运。