具有KL分歧的文本聚类

时间:2017-12-11 16:01:04

标签: text scikit-learn cluster-computing hierarchical-clustering

我正在尝试对基于平滑的Dirichlet priors bigrams的每个我定义语言模型的文本进行聚类,所以我想使用k-means算法来做到这一点,使用KL发散可能作为聚类函数。有没有指导呢?我能使用经典的相似性度量之一,如余弦相似度吗?

提前谢谢

0 个答案:

没有答案