假设我有一个pandas.DataFrame
和一个字符串列表:
fruit = ['apple', 'banana', 'cherry' ] # etc
是否有一种整洁的方法来选择行,其中该列的值包含(作为子字符串)列表中的一个字符串?
我知道isin
,它会根据可能性列表检查列的整个值:
df[df['column'].isin(fruit)]
和contains
,将其与单个字符串匹配:
df[df['column'].str.contains('apple')]
这些似乎都不是我想要的。在其他语言中,我可以使用循环来执行某些操作,但是对于处理数据的熊猫风格我还是很陌生,因此不确定如何进行。字符串列表也很大(几千个项目),因此将其编译成一个正则表达式以进行匹配似乎不是一个好主意。