在文本上解释聚类结果

时间:2016-05-30 18:49:48

标签: python matplotlib machine-learning k-means

我是初学者,学习机器学习,并在文本文档中以k表示集群

我通过创建一个tf-idf矩阵,计算余弦相似度,然后拟合来实现这一点。

按照教程,我使用了多维缩放(这对我来说是黑魔法),但Matplotlib产生的数据表明在外圈上绘制了一个簇。

有关解释出错或这意味着什么的任何想法?

我没有包含任何代码。我想读者会想要澄清一些关键点。其中我将尝试回答

  1. 数据是什么?创业公司的职位描述
  2. 最大/最小DF? .85和.2分别
  3. 构建图形的过程?

    一个。使用MDS转换TFIDF矩阵的1-余弦相似性

    湾情节与熊猫

  4. 我应该尝试区分层次聚类还是LDA?

    k means clustering on documents

0 个答案:

没有答案