我有一个包含200多个行的DataFrame,我想向其中添加一些新列。我知道如何使用apply
和我为这份工作编写的函数来做到这一点。
_worked_df[columns_names]=_worked_df['MyBaseColumn'][_worked_df['MyBaseColumn']==_worked_df['MyBaseColumn']].apply(lambda x: tableFromProfile(x,debug=True)['Status'])
问题是此函数在网络上调用API,有时会失败(因为API返回的数据丢失或出现其他错误)。尽管有一些try: except:
,但我仍然无法在API返回的数据中捕获所有错误,因此我的应用失败了(显然新列在计算结束时立即全部添加了)
我想完成今天的工作,所以我决定分批完成工作,并制作一个数据框,上面写着10 rows
和列[A,B,C,D,E,F,G]
,我是尝试将其合并到具有200多个行且仅包含列[A,B,C]
的基本DataFrame中。
因此,我需要追加到D,E,F,G
列没有值的行,如果这些列不存在,则创建它们。
我已经尝试过pd.DataFrame.update
,但是它不会更新基本DataFrame中不存在的列。我已经读过append
,但这似乎仅适用于添加行,而merge
和join
无法检查我的数据是否具有重叠的列。
我必须以一种方式进行操作,当我更新下一个批次时,它不会擦除上一步的结果。