应用错误收集

在scikit-learn

时间：2019-01-24 12:37:54

标签： scikit-learn cluster-analysis text-mining

我正在为一堆新闻文本尝试不同的聚类方法，并且正在努力寻找任何方法来为sklearns亲和力传播找到每个聚类的顶级术语，并且不确定是否可能。

对于k均值聚类，我使用的方法与此处相同：https://scikit-learn.org/0.19/auto_examples/text/document_clustering.html 从逻辑上讲，我希望对亲和力传播使用与x均值相同的X。

有人知道如何通过亲和力传播产生相似的结果吗？

1 个答案:

答案 0 :(得分：0)

您可以计算均值，并像对k均值一样进行分析。

为获得更好的结果，如果sklearn API公开了文档，则可以按责任因子衡量每个文档。