字到音节转换器

时间:2012-05-08 14:15:33

标签: c++ nlp linguistics

我正在用c ++编写一段代码,其中我需要一个单词到音节转换器是否有任何开源标准算法可用或任何其他链接可以帮助我构建一个。

for a word like invisible syllable would be in-viz-uh-ble

理想情况下,它应该能够解析复杂的单词,如“隐形”。

我已经在perl和python中找到了算法链接,但我想知道c ++中是否有任何库

非常感谢。

2 个答案:

答案 0 :(得分:4)

您的示例显示了该单词的语音表示,而不仅仅是分为音节。这是一个复杂的NLP问题。

查看soundexmetaphone。两者都有C / C ++实现。

许多字典也提供了IPA字的符号。看看维基词典。

答案 1 :(得分:0)

为了检测单词中的音节,您可以根据自己的需要调整我的项目。 它被称为tinyhyphenator

它为您提供一个单词中所有可能的连字索引的整数列表。对于德国人来说,它完全呈现。您必须获取索引列表并自己插入连字符。

通过"适应"我的意思是添加英语音节的规格。看看源代码,它应该是非常自我解释的。