如何检测同音字

时间:2014-10-01 04:17:54

标签: nlp speech-recognition voice-recognition

我对语音处理相当新,但想知道如何检测到homophones。我正在寻找一种API,它根据它们的发音方式给出两个单词之间的相似性。

例如:" to"和"两个"就他们的声音方式而言是非常相似的说法" to"和"来自"。

2 个答案:

答案 0 :(得分:2)

你可能想尝试不是在原始字符串上计算编辑距离,而是在发音上计算,就像它们在http://www.speech.cs.cmu.edu/cgi-bin/cmudict

中的CMU发音字典中一样

答案 1 :(得分:0)

以下内容用于按英语发音SoundexMetaphone索引字词。您可以使用Fuzzy之类的python包来实现多种索引算法。

import fuzzy