应用错误收集

我希望能够深入了解我的数据。我正在使用sklearn PCA将它们转换为VSM并将它们绘制到matplotlib图形中。这涉及

使用管道将文档转换为数字矩阵

test = pipeline.fit_transform(docs).todense()

最后，我正在使用Matplotlib

绘制结果

   plt.scatter(data[:,0], data[:,1], c = categories)

我的问题是：如何使用新句子并确定与其他文件相关的位置。用X来标记它们的相对位置？

由于