我读了很多帖子,例如:
我已经找到了double metaphone code。
但是双元电话算法会返回给定字符串的元组,假设该字符串是单个字。有没有人知道一个语音算法可以用于同名的多个单词?如果没有,最好只想编写一个脚本来计算此列中每个单词的字数,然后对我的数据集中最常出现的单元格中的单词运行双变量电话?
答案 0 :(得分:2)
实际上,metaphone或双联想电话的设计不仅仅适用于专有名称而不适用于“字典单词”。 metaphone,双metaphone和metaphone 3都设计为使用名称和单词,并针对包含两者的数据库开发