可视化PCA转换的数据

时间:2015-11-28 09:45:07

标签: python machine-learning k-means pca unsupervised-learning

我有一个数据集,我想用k-means进行聚类 作为先前的任务,我在这些数据上运行PCA,并确定了两个组件,它们代表了我数据集的近90%的信息。 我想想象这两个组件,以便得出一些见解。

Route::get('/CheckCustomerTransactionPayment/{id}', 'PaymentTransactionController@check');

enter image description here

接下来,我尝试可视化相同的转换数据,但是来自转置矩阵

pca = PCA(n_components=2)
data_trans = pca.fit_transform(data)
plt.scatter(data_trans[:, 0], data_trans[:, 1])

enter image description here

最后的情节是否表明我的数据中可能有6个群集? 如果有的话,我可以从这两张图中得出什么结论?

1 个答案:

答案 0 :(得分:1)

你看到的6点不是集群。

它们是您的输入尺寸。

因为您使用了转置矩阵。

判断feom高于阴谋,我怀疑聚类会在那里找到任何有意义的东西。异常值和一个大blob就是情节所包含的内容。