熊猫更新添加新列

时间:2019-12-23 10:29:30

标签: python pandas dataframe

背景

我有一个包含200多个行的DataFrame,我想向其中添加一些新列。我知道如何使用apply和我为这份工作编写的函数来做到这一点。

_worked_df[columns_names]=_worked_df['MyBaseColumn'][_worked_df['MyBaseColumn']==_worked_df['MyBaseColumn']].apply(lambda x: tableFromProfile(x,debug=True)['Status'])

问题是此函数在网络上调用API,有时会失败(因为API返回的数据丢失或出现其他错误)。尽管有一些try: except:,但我仍然无法在API返回的数据中捕获所有错误,因此我的应用失败了(显然新列在计算结束时立即全部添加了)

问题

我想完成今天的工作,所以我决定分批完成工作,并制作一个数据框,上面写着10 rows和列[A,B,C,D,E,F,G],我是尝试将其合并到具有200多个行且仅包含列[A,B,C]的基本DataFrame中。

因此,我需要追加到D,E,F,G列没有值的行,如果这些列不存在,则创建它们。

我已经尝试过pd.DataFrame.update,但是它不会更新基本DataFrame中不存在的列。我已经读过append,但这似乎仅适用于添加行,而mergejoin无法检查我的数据是否具有重叠的列。

我必须以一种方式进行操作,当我更新下一个批次时,它不会擦除上一步的结果。

0 个答案:

没有答案