我正在应用一些处理,例如将矩阵元素从一个矩阵索引值替换为另一个矩阵索引值。它工作正常。
ds1 = [[ 4, 13, 6, 9],
[ 7, 12, 5, 7],
[ 7, 0, 4, 22],
[ 9, 8, 12, 0]]
ds2 = [[ 4, 1],
[ 5, 3],
[ 6, 1],
[ 7, 2],
[ 4, 1 ],
[ 8, 2],
[ 9, 3],
[12, 1],
[13, 2],
[22, 3]]
ds1= pd.DataFrame(ds1)
ds2= pd.DataFrame(ds2)
#Processing ds1 by replacing
print type(ds2)
ds2 = ds2.groupby(0).mean() #.........X
print type(ds2)
C = np.where(ds1.values.ravel()[:, None] == ds2.values[:, 0])
ds1_new = ds1.values.ravel()
ds1_new[C[0]]=ds2.values[C[1], 1] #when I comment line x, it works.Otherwise getting error on this line
ds1_new = ds1_new.reshape(4,4)
使用ds2 = ds2.groupby(0).mean()
背后的原因是获得类似元素的平均值。当我取消注释它时,它可以正常工作。
版本
Python 2.7.3
numpy - 1.9.2
pandas - 0.15.2
修改
我的主要目标是将ds2
的索引值与ds1
匹配,并将其替换为相应的值,因此输出看起来像
ds1_new = [[ 1, 2, 1, 3],
[ 2, 1, 3, 2],
[ 2, 0, 1, 3],
[ 3, 2, 1, 0]]
答案 0 :(得分:1)
我敢打赌,这比你想象的要容易。首先,让ds2
成为字典而不是数据帧。
ds2 = dict([
[ 4, 1],
[ 5, 3],
[ 6, 1],
[ 7, 2],
[ 4, 1],
[ 8, 2],
[ 9, 3],
[12, 1],
[13, 2],
[22, 3]])
现在,我们只需使用ds2
直接映射ds1
中的所有元素:
ds3 = ds1.copy()
for i in range(4):
ds3[i] = ds3[i].map( ds2 )
0 1 2 3
0 1 2 1 3
1 2 1 3 2
2 2 NaN 1 3
3 3 2 1 NaN
如果您想要0
而不是NaN,请执行ds3.fillna(0)
。
出于某种原因,我无法让它发挥作用:
ds3.applymap( ds2 )
但这样可以避免循环遍历列,尽管语法不像系列那样简单:
ds1.applymap( lambda x: ds2.get(x,0) )