pandas-选择DataFrame的行,其中一列在列表中具有子字符串

时间:2018-09-12 15:48:03

标签: python string pandas performance dataframe

假设我有一个pandas.DataFrame和一个字符串列表:

fruit = ['apple', 'banana', 'cherry' ] # etc

是否有一种整洁的方法来选择行,其中该列的值包含(作为子字符串)列表中的一个字符串?

我知道isin,它会根据可能性列表检查列的整个值:

df[df['column'].isin(fruit)]

contains,将其与单个字符串匹配:

df[df['column'].str.contains('apple')]

这些似乎都不是我想要的。在其他语言中,我可以使用循环来执行某些操作,但是对于处理数据的熊猫风格我还是很陌生,因此不确定如何进行。字符串列表也很大(几千个项目),因此将其编译成一个正则表达式以进行匹配似乎不是一个好主意。

0 个答案:

没有答案