我希望能够深入了解我的数据。我正在使用sklearn PCA将它们转换为VSM并将它们绘制到matplotlib图形中。这涉及
使用管道将文档转换为数字矩阵
test = pipeline.fit_transform(docs).todense()
适合我的模特
pca = PCA().fit(test)
然后我使用转换
转换它 data = pca.transform(test)
最后,我正在使用Matplotlib
绘制结果 plt.scatter(data[:,0], data[:,1], c = categories)
我的问题是:如何使用新句子并确定与其他文件相关的位置。用X来标记它们的相对位置?
由于