Levenhstein距离聚类,词太小

时间:2019-01-24 12:50:39

标签: r

我使用levenhstein距离来计算单词之间的距离,然后使用聚类对具有拼写错误的相似单词进行聚类。但是,由于某些单词太小(即2个字母),因此它们的Lecenhstein距离太小,因此分类错误。有没有考虑单词长度的加权莱文斯坦距离加权方法?

0 个答案:

没有答案