我想比较数据框的两列,以检查值是否随时间变化。数据框来自json,所以我有包含列表的列,我也希望在流程结束时也有列表
我的df列:
supplier_name_atb sup_id
0 [recNzgDaNFph63q4B]
1 [recNzgDaNFph63q4B] [recNzgDaNFph63q4B]
2 [rec4vKwXHZgzrrVaD] [rec4vKwXHZgzrrVaD,recMyX5afNLaQR2qw]
3 [rec4vKwXHZgzrrVaD] [rec4vKwXHZgzrrVaD]
4 [recMyX5afNLaQR2qw] [recMyX5afNLaQR2qw]
要进行比较,我正在使用:
df2 = df.query('supplier_name_atb != sup_id').reset_index()
我得到的结果是完全相同的df,当我在列中有列表时,他似乎不了解差异。
我的预期结果是:
supplier_name_atb sup_id
0 [recNzgDaNFph63q4B]
1 [rec4vKwXHZgzrrVaD] [rec4vKwXHZgzrrVaD,recMyX5afNLaQR2qw]
我该如何解决? 关于类型:两种列类型都是对象
编辑:我已经尝试过这个建议:
df[df['supplier_name_atb'] != df['sup_id']].reset_index(drop=True)
它仍然给我相同的数据框。