我正在为一堆新闻文本尝试不同的聚类方法,并且正在努力寻找任何方法来为sklearns亲和力传播找到每个聚类的顶级术语,并且不确定是否可能。
对于k均值聚类,我使用的方法与此处相同:https://scikit-learn.org/0.19/auto_examples/text/document_clustering.html 从逻辑上讲,我希望对亲和力传播使用与x均值相同的X。
有人知道如何通过亲和力传播产生相似的结果吗?
答案 0 :(得分:0)
您可以计算均值,并像对k均值一样进行分析。
为获得更好的结果,如果sklearn API公开了文档,则可以按责任因子衡量每个文档。