熊猫:比较包含列表的两列的值

时间:2020-05-07 13:27:41

标签: python pandas list object

我想比较数据框的两列,以检查值是否随时间变化。数据框来自json,所以我有包含列表的列,我也希望在流程结束时也有列表

我的df列:

        supplier_name_atb               sup_id
0     [recNzgDaNFph63q4B]
1     [recNzgDaNFph63q4B]  [recNzgDaNFph63q4B]
2     [rec4vKwXHZgzrrVaD]  [rec4vKwXHZgzrrVaD,recMyX5afNLaQR2qw]
3     [rec4vKwXHZgzrrVaD]  [rec4vKwXHZgzrrVaD]
4     [recMyX5afNLaQR2qw]  [recMyX5afNLaQR2qw]

要进行比较,我正在使用:

df2 = df.query('supplier_name_atb != sup_id').reset_index()

我得到的结果是完全相同的df,当我在列中有列表时,他似乎不了解差异。

我的预期结果是:

        supplier_name_atb               sup_id
0     [recNzgDaNFph63q4B]
1     [rec4vKwXHZgzrrVaD]  [rec4vKwXHZgzrrVaD,recMyX5afNLaQR2qw]

我该如何解决? 关于类型:两种列类型都是对象

编辑:我已经尝试过这个建议:

df[df['supplier_name_atb'] != df['sup_id']].reset_index(drop=True)

它仍然给我相同的数据框。

0 个答案:

没有答案