标签: python nlp cluster-analysis hierarchical-clustering unsupervised-learning
我创建了一个模型,用于使用层次聚类对相似的术语进行聚类,并使用Levenshtein距离作为聚类的度量。现在,我希望找到簇数的最佳值。请参阅此研究论文以了解我的实现。在本文中,他们使用BIC来找到最佳聚类数
https://ieeexplore.ieee.org/document/7765062/
请优先提供python教程代码。