我的初始数据框看起来像这样
A | B
-----------------
'a' | ['1', 'a', 'b']
'1' | ['2', '5', '6']
'd' | ['a', 'b', 'd']
'y' | ['x', '1', 'y']
我想检查B中相应列表中是否有'a':['1','a','b']
我可以使用apply
来做到这一点df.apply(lambda row: row[['A']][0] in row[['B']][0], axis=1)
给了我预期的结果:
[True, False, True, True]
但是我拥有的真实数据(数百万行)非常重,需要很长时间。 是否有更有效的方法来做同样的事情? 例如使用numpy elementwise操作还是其他任何东西?