当我使用带有熊猫的Jupyter Notebooks中的数据框时,我可以进行大量的批量操作,例如:
df_color_pallette.loc[df_color_pallette['foreground']=='red','foreground']='green'
要将“前景”列中的每个条目从“红色”更改为“绿色”。但是,如果我想知道更改了哪些条目,或者甚至只进行了多少更改,则必须例如将列的副本保留为“ before”,然后将其与更改后的列进行比较(是的,我已经做到了)。但这似乎效率很低,迫使至少2次通过数据。他们是拥有该信息的任何熊猫钩子/日志/标志吗?
答案 0 :(得分:1)
您可以跟踪面具
mask = df_color_pallette['foreground'] == 'red'
df_color_pallette.loc[mask, 'foreground'] == 'green'
然后检查
mask.sum()
甚至可以再次更改
df_color_pallette.loc[mask, 'foreground'] == 'beige'