熊猫:检查A系列中的单词是否以B系列中的一个单词结尾的最快方法

时间:2014-09-04 15:07:03

标签: python performance pandas

我想检查名为strings的系列中的单词是否以系列ending_strings中的一个单词结尾。

strings = Series(['om', 'foo_nom', 'nom', 'bar_foo', 'foo','blah'])
ending_strings = Series(['nom', 'foo'])
expected_results = Series([False, True, True, True, True, False])

我已经提出了以下代码,但是有更快或更多的熊猫风格的方法吗?

from pandas import Series

def ew(v):
    return strings.str.endswith(v) 
result = ending_strings.apply(ew).apply(sum).astype(bool)
result.equals(expected_results)

1 个答案:

答案 0 :(得分:14)

你可以在这里传递endswith一个元组(所以你也可以使用它而不是系列):

>>> strings = Series(['om', 'foo_nom', 'nom', 'bar_foo', 'foo','blah'])
>>> ending_strings = ("nom", "foo")
>>> strings.str.endswith(ending_strings)
0    False
1     True
2     True
3     True
4     True
5    False
dtype: bool