我有一个数据集,我想用k-means进行聚类 作为先前的任务,我在这些数据上运行PCA,并确定了两个组件,它们代表了我数据集的近90%的信息。 我想想象这两个组件,以便得出一些见解。
Route::get('/CheckCustomerTransactionPayment/{id}', 'PaymentTransactionController@check');
接下来,我尝试可视化相同的转换数据,但是来自转置矩阵
pca = PCA(n_components=2)
data_trans = pca.fit_transform(data)
plt.scatter(data_trans[:, 0], data_trans[:, 1])
最后的情节是否表明我的数据中可能有6个群集? 如果有的话,我可以从这两张图中得出什么结论?
答案 0 :(得分:1)
你看到的6点不是集群。
它们是您的输入尺寸。
因为您使用了转置矩阵。
判断feom高于阴谋,我怀疑聚类会在那里找到任何有意义的东西。异常值和一个大blob就是情节所包含的内容。