标签: python cluster-analysis levenshtein-distance hierarchical
根据我之前的问题,我已经使用Python和DSP实现了大量字符串的聚类算法。 Levenshtein距离..但是需要很长时间才能完成聚类。有什么建议吗?
<> 在for循环中迭代列表 对于列表中的每个项目 再次浏览列表,找到相似百分比 如果相似性>阈值,移动到群集 结束循环
答案 0 :(得分:0)
首先,使用分析器查看大部分时间花在哪里。我怀疑它是在实际的Levenshtein计算中,但确定是好的。 Iff是: