如何通过查找行中的值来矢量化替换。
对于数据框如下:
df = pd.DataFrame([(1, 2, 3, 4, np.NaN, np.NaN, 4),
(1, 2, 3, 0, 0, np.NaN, 0),
(1, 2, 3, 4, 5, np.NaN, 5)],
columns = ['P0', 'P1', 'P2', 'P3', 'P4', 'P5', 'Last_not_NaN_value'],
index = ['row1', 'row2', 'row3'])
输出df:
P0 P1 P2 P3 P4 P5 Last_not_NaN_value
row1 1 2 3 4 NaN NaN 4
row2 1 2 3 0 0.0 NaN 0
row3 1 2 3 4 5.0 NaN 5
我该怎么做
df.replace(df['Last_not_NaN_value'], 0 )
< - 什么也没做。
如何查找df中last_not_NaN_value
的位置,并将其替换为0,例如:
P0 P1 P2 P3 P4 P5 Last_not_NaN_value
row1 1 2 3 *0* NaN NaN 4
row2 1 2 3 0 *0* NaN 0
row3 1 2 3 4 *0* NaN 5
答案 0 :(得分:2)
按要求进行矢量化。执行广播比较,找到替换的索引,并相应地进行替换。之后,您可以使用整洁的df[:] = ...
技巧分配结果。
v = df.values
i = v[:, :-1]
j = v[:, -1]
v[np.arange(v.shape[0]), (i == j[:, None]).argmax(axis=1)] = 0
df[:] = v
df
P0 P1 P2 P3 P4 P5 Last_not_NaN_value
row1 1.0 2.0 3.0 0.0 NaN NaN 4.0
row2 1.0 2.0 3.0 0.0 0.0 NaN 0.0
row3 1.0 2.0 3.0 4.0 0.0 NaN 5.0
答案 1 :(得分:0)
这是一个解决方案,虽然没有矢量化:
for i in range(6):
df.loc[i==(df['Last_not_NaN_value']-1), 'P'+str(i)] = 0
# P0 P1 P2 P3 P4 P5 Last_not_NaN_value
# row1 1 2 3 0 NaN NaN 4
# row2 1 2 3 0 0.0 NaN 0
# row3 1 2 3 4 0.0 NaN 5