我对语音处理相当新,但想知道如何检测到homophones。我正在寻找一种API,它根据它们的发音方式给出两个单词之间的相似性。
例如:" to"和"两个"就他们的声音方式而言是非常相似的说法" to"和"来自"。
答案 0 :(得分:2)
你可能想尝试不是在原始字符串上计算编辑距离,而是在发音上计算,就像它们在http://www.speech.cs.cmu.edu/cgi-bin/cmudict
中的CMU发音字典中一样答案 1 :(得分:0)