我的数据框如下:
datetime1 datetime2 datetime3 datetime4
id
1 5 6 5 5
2 7 2 3 5
3 4 2 3 2
4 6 4 4 7
5 7 3 8 9
我有一个像这样的numpy数组:
index_arr = [3, 2, 0, 1, 2]
此numpy数组分别引用我要替换的每一行中的索引。我要在替换中使用的值在另一个numpy数组中:
replace_arr = [14, 12, 23, 17, 15]
使更新的数据框看起来像这样:
datetime1 datetime2 datetime3 datetime4
id
1 5 6 5 14
2 7 2 12 5
3 23 2 3 2
4 6 17 4 7
5 7 3 15 9
快速进行此更换的最佳方法是什么?我尝试使用枚举和迭代,但是无法使用语法。感谢您的帮助-谢谢
答案 0 :(得分:3)
这是np.put_along_axis
的一种方式-
In [50]: df
Out[50]:
datetime1 datetime2 datetime3 datetime4
1 5 6 5 5
2 7 2 3 5
3 4 2 3 2
4 6 4 4 7
5 7 3 8 9
In [51]: index_arr = np.array([3, 2, 0 ,1 ,2])
In [52]: replace_arr = np.array([14, 12, 23, 17 ,15])
In [53]: np.put_along_axis(df.to_numpy(),index_arr[:,None],replace_arr[:,None],axis=1)
In [54]: df
Out[54]:
datetime1 datetime2 datetime3 datetime4
1 5 6 5 14
2 7 2 12 5
3 23 2 3 2
4 6 17 4 7
5 7 3 15 9
答案 1 :(得分:2)
IIUC,您只需分配给.values
(或。to_numpy(copy=False)
)即可:
# <= 0.23
df.values[np.arange(len(df)), index_arr] = replace_arr
# 0.24+
df.to_numpy(copy=False)[np.arange(len(df)), index_arr] = replace_arr
df
datetime1 datetime2 datetime3 datetime4
id
1 5 6 5 14
2 7 2 12 5
3 23 2 3 2
4 6 17 4 7
5 7 3 15 9
答案 2 :(得分:2)
最后使用.iat
for x, y ,z in zip(np.arange(len(df)),index_arr ,replace_arr ):
df.iat[x,y]=z
df
Out[657]:
datetime1 datetime2 datetime3 datetime4
id
1 5 6 5 14
2 7 2 12 5
3 23 2 3 2
4 6 17 4 7
5 7 3 15 9