在scikit-learn

时间:2019-01-24 12:37:54

标签: scikit-learn cluster-analysis text-mining

我正在为一堆新闻文本尝试不同的聚类方法,并且正在努力寻找任何方法来为sklearns亲和力传播找到每个聚类的顶级术语,并且不确定是否可能。

对于k均值聚类,我使用的方法与此处相同:https://scikit-learn.org/0.19/auto_examples/text/document_clustering.html 从逻辑上讲,我希望对亲和力传播使用与x均值相同的X。

有人知道如何通过亲和力传播产生相似的结果吗?

1 个答案:

答案 0 :(得分:0)

可以计算均值,并像对k均值一样进行分析。

为获得更好的结果,如果sklearn API公开了文档,则可以按责任因子衡量每个文档。