我想检查pandas数据框列是否包含列表中的特定字符串,如果为true,则将该字符串放入新列中。我知道我可以通过多次循环来做到这一点,但是根据我在文件中得到的行数,我认为它会非常慢。
In [0]: mylist = ['ABC', 'ACB', 'DCB', 'AXR12-1']
In [1]: df
Out[1]:
text
0 ABC KEY778 20225
1 XXX11 K ABC 14452GXX
2 ACB AZZXG112
3 DCB AA112G AXXX
4 DCB AA15G AXR12-1
结果
In [2]: df
Out[2]:
text extract
0 ABC KEY778 20225 ABC
1 XXX11 K ABC 14452GXX ABC
2 ACB AZZXG112 ACB
3 DCB AA112G AXXX DCB
4 DCB AA15G AXR DCB AXR12-1
您有一种简单的方法吗? 谢谢