这些天我正在学习大熊猫。在数据帧上使用fill_value
时,我对add()
参数有一个基本的问题。
想象一下,我有以下数据:
dframe1
:
A B
NYC 0 1
LA 2 3
dframe2
:
A D C
NYC 0 1 2
SF 3 4 5
LA 6 7 8
执行dframe1.add(dframe2,fill_value=0)
会产生:
A B C D
LA 8.0 3.0 8.0 7.0
NYC 0.0 1.0 2.0 1.0
SF 3.0 NaN 5.0 4.0
为什么我会为NaN
列获取B
,索引为SF
?
我希望fill_value
确保NaN
没有结果 - 在这种情况下 - 假设列D
,C
和索引SF
存在0
的值dframe1
。
答案 0 :(得分:1)
根据http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.add.html
可能是这样的情况:
使用此值填充缺失(NaN)值。 如果缺少两个DataFrame位置,结果将会丢失。
我打赌你已经知道了大熊猫的fillna
:
df.fillna('', inplace=True)