绘制新文档以分散绘图

时间:2017-08-11 13:32:00

标签: python matplotlib scikit-learn pca

我希望能够深入了解我的数据。我正在使用sklearn PCA将它们转换为VSM并将它们绘制到matplotlib图形中。这涉及

  1. 使用管道将文档转换为数字矩阵

    test = pipeline.fit_transform(docs).todense()
    
  2. 适合我的模特

    pca = PCA().fit(test)
    
  3. 然后我使用转换

    转换它
        data = pca.transform(test)
    
  4. 最后,我正在使用Matplotlib

    绘制结果
       plt.scatter(data[:,0], data[:,1], c = categories)
    
  5. 我的问题是:如何使用新句子并确定与其他文件相关的位置。用X来标记它们的相对位置?

    由于

0 个答案:

没有答案