简单的散点图帮助:太多的指标?

时间:2017-05-06 04:03:24

标签: python pandas numpy matplotlib

我有以下代码我想了解,我希望它非常简单,我只是不理解它:

这些是我使用过的物体的形状:

X_train2.shape, num_eigen_pairs.shape, X_train2_pca.shape, y_train1.shape
((13626L, 18093L), (18093L, 2L), (13626L, 2L), (18093L, 2L))

现在我已经找到了一些试图绘制我的PCA组件的代码:

colors = ['r', 'b', 'g']
markers = ['s', 'x', 'o']
for l, c, m in zip(np.unique(y_train1), colors, markers):
    scatter(X_train2_pca[y_train1==l, 0], X_train2_pca[y_train1==l, 1],
    c=c, label=l, marker=m)

但是我真的很难理解这段代码中的指标是如何工作的,因此出现以下错误:

  

X_train2_pca [y_train1 == l,1]回溯(最近一次呼叫最后一次):

     

文件"",第1行,in       X_train2_pca [y_train1 == l,1]

     

IndexError:数组索引太多

有人可以根据我的数据形状帮助我了解我需要提供哪些指标?

我希望这样的图表(你可以看到原始代码): enter image description here

1 个答案:

答案 0 :(得分:1)

你试图用形状(13626L,2L)索引 X_train2_pca ,其中索引器( y_train1 == l )具有形状( 18093L,2L )。

X_train2_pca 索引器应该有形状(13626L,1L)。

考虑到变量名称,也许你已经用y_train 2 切换了y_train 1