Question

我有以下代码我想了解，我希望它非常简单，我只是不理解它：

这些是我使用过的物体的形状：

X_train2.shape, num_eigen_pairs.shape, X_train2_pca.shape, y_train1.shape
((13626L, 18093L), (18093L, 2L), (13626L, 2L), (18093L, 2L))

现在我已经找到了一些试图绘制我的PCA组件的代码：

colors = ['r', 'b', 'g']
markers = ['s', 'x', 'o']
for l, c, m in zip(np.unique(y_train1), colors, markers):
    scatter(X_train2_pca[y_train1==l, 0], X_train2_pca[y_train1==l, 1],
    c=c, label=l, marker=m)

但是我真的很难理解这段代码中的指标是如何工作的，因此出现以下错误：

X_train2_pca [y_train1 == l，1]回溯（最近一次呼叫最后一次）：

文件＆＃34;＆＃34;，第1行，in       X_train2_pca [y_train1 == l，1]

IndexError：数组索引太多

有人可以根据我的数据形状帮助我了解我需要提供哪些指标？

我希望这样的图表（你可以看到原始代码）：

Answer 1

你试图用形状（13626L，2L）索引 X_train2_pca ，其中索引器（ y_train1 == l ）具有形状（ 18093L，2L ）。

X_train2_pca 索引器应该有形状（13626L，1L）。

考虑到变量名称，也许你已经用y_train 2 切换了y_train 1 。

简单的散点图帮助：太多的指标？

1 个答案: