我正在连接多个月csv's
,其中较新的,更新版本有其他列。因此,将它们全部放在一起会使用NaN
填充某些列的某些行。
此行为的问题在于它将这些NaN
与来自数据集的真空条目混合,这些条目需要易于区分。
我现在唯一的解决方案是用唯一的字符串替换原始的NaN,连接csv,用第二个唯一的字符串替换新的NaN,用NaN替换第一个唯一的字符串。
鉴于我正在处理的数据量,这是一个非常低效的解决方案。我认为有一些方法可以确定Panda DataFrame
如何填写这些条目,但无法找到任何内容。
更新示例:
A B
1 NaN
2 3
并追加
A B C
1 2 3
给予
A B C
1 NaN NaN
2 3 NaN
1 2 3
但我想要
A B C
1 NaN 'predated'
2 3 'predated'
1 2 3
答案 0 :(得分:2)
如果您有一组核心列,如df1
所示,您可以将.fillna()
应用于核心集与最近{的任何新列之间的.difference()
{ {1}}。
DataFrames