CMUdict适用于英语,但如果我想用另一种语言计算内容的音节怎么办?
答案 0 :(得分:3)
这取决于语言。这听起来似乎是一个明显的答案,但这一切都归结为拼写法的设计方式。在英语中,音节几乎与单词的写法无关,所以你需要一本字典。许多其他语言都是这样的。
某些其他语言(如(南方)韩语,日语平假名和片假名(但不汉字))是以这样的方式编写的,即字符本身显然与音节或音节相匹配特定数量的音节。在这种情况下,如果您知道这些语言是如何工作的,理论上您可以使用Python来打破写入音节。
否则,您需要一本字典或其他一些处理此问题的编译平台。捅nltk
,看看你能找到什么。
答案 1 :(得分:2)
一般来说,没有。对于某些语言可能存在,但如果您没有字典,则需要了解这些语言的语言结构。单词如何分为音节因语言而异。
答案 2 :(得分:0)
对于所有语言,你当然不能以一般的方式做到这一点,因为不同的语言会以不同的方式呈现文本。
例如,匈牙利语单词“vagy”对于说英语的人来说就像是两个音节,但它只是一个。英语单词“bike”自然会被许多其他语言的发音者读作2个音节。
此外,对于英语而言,如果没有字典,你可能无法做到这一点,因为英语在拼写方面有很多奇怪的变化。例如,我们将“诗人”中的“oe”称为两个不同的音节,但在“确实”中只有一个。这也可能适用于其他一些语言。