标签: r
我使用levenhstein距离来计算单词之间的距离,然后使用聚类对具有拼写错误的相似单词进行聚类。但是,由于某些单词太小(即2个字母),因此它们的Lecenhstein距离太小,因此分类错误。有没有考虑单词长度的加权莱文斯坦距离加权方法?