IndexError:索引1超出轴1的大小为1的范围

时间:2015-05-25 05:00:58

标签: python numpy pandas

我正在应用一些处理,例如将矩阵元素从一个矩阵索引值替换为另一个矩阵索引值。它工作正常。

ds1 = [[ 4, 13,  6,  9],
      [ 7, 12,  5,  7],
      [ 7,  0,  4, 22],
      [ 9,  8, 12,  0]]

ds2 = [[ 4,  1],
       [ 5,  3],
       [ 6,  1],
       [ 7,  2],
       [ 4, 1 ],
       [ 8,  2],
       [ 9,  3],
       [12,  1],
       [13,  2],
       [22,  3]]

ds1= pd.DataFrame(ds1)
ds2= pd.DataFrame(ds2)

#Processing ds1 by replacing
print type(ds2)
ds2 = ds2.groupby(0).mean() #.........X
print type(ds2)
C = np.where(ds1.values.ravel()[:, None] == ds2.values[:, 0])
ds1_new = ds1.values.ravel()
ds1_new[C[0]]=ds2.values[C[1], 1]  #when I comment line x, it works.Otherwise getting error on this line
ds1_new = ds1_new.reshape(4,4)

使用ds2 = ds2.groupby(0).mean()背后的原因是获得类似元素的平均值。当我取消注释它时,它可以正常工作。

版本

Python 2.7.3
numpy - 1.9.2
pandas - 0.15.2

修改

我的主要目标是将ds2的索引值与ds1匹配,并将其替换为相应的值,因此输出看起来像

ds1_new = [[ 1, 2,  1,  3],
      [ 2, 1,  3,  2],
      [ 2,  0,  1, 3],
      [ 3,  2, 1,  0]]

1 个答案:

答案 0 :(得分:1)

我敢打赌,这比你想象的要容易。首先,让ds2成为字典而不是数据帧。

 ds2 = dict([
       [ 4,  1],
       [ 5,  3],
       [ 6,  1],
       [ 7,  2],
       [ 4,  1],
       [ 8,  2],
       [ 9,  3],
       [12,  1],
       [13,  2],
       [22,  3]])

现在,我们只需使用ds2直接映射ds1中的所有元素:

ds3 = ds1.copy()
for i in range(4):
    ds3[i] = ds3[i].map( ds2 )

   0   1  2   3
0  1   2  1   3
1  2   1  3   2
2  2 NaN  1   3
3  3   2  1 NaN

如果您想要0而不是NaN,请执行ds3.fillna(0)

出于某种原因,我无法让它发挥作用:

ds3.applymap( ds2 )

但这样可以避免循环遍历列,尽管语法不像系列那样简单:

ds1.applymap( lambda x: ds2.get(x,0) )