我有一个公共政府数据集,其中有两列用于显示含税和不含税的金额。有些行同时具有(相同的编号),有些行在其中一列中。 两列中的金额相同,因此我的伪代码为: 基于列A将两列合并 如果A列已经有值,请跳过
通过这种方式,我可以洞察并绘制结果,因为所有值都在一栏中。
我在这里找到最接近的答案Pandas - combine two columns 但是在某些情况下,该数据集在两列中都没有值。
COLUMN A COLUMN B
NA 333432
NA 23423424
5476 NA
648123 648123
NA 86754
45632 45632
94785 94785
238400 NA
如果我使用 df.x.combine_first(df.y) 一些行将被删除。
谢谢。