我有一个值列表。如何替换不在给定值列表中的Dataframe列中的所有值?
例如,
>>> df = pd.DataFrame(['D','ND','D','garbage'], columns=['S'])
>>> df
S
0 D
1 ND
2 D
3 garbage
>>> allowed_vals = ['D','ND']
我想用“无”替换数据框的列S中不在列表allowed_vals中的所有值。我怎么能这样做?
答案 0 :(得分:6)
您可以使用isin
检查allowed_list
,~
中的成员资格以取消该成员资格,然后使用.loc
修改该系列:
>>> df.loc[~df["S"].isin(allowed_vals), "S"] = "None"
>>> df
S
0 D
1 ND
2 D
3 None
,因为
>>> df["S"].isin(allowed_vals)
0 True
1 True
2 True
3 False
Name: S, dtype: bool
如果要修改整个帧(而不仅仅是列S),可以制作一个帧大小的掩码:
>>> df
S T
0 D D
1 ND A
2 D ND
3 garbage A
>>> df[~df.isin(allowed_vals)] = "None"
>>> df
S T
0 D D
1 ND None
2 D ND
3 None None