Pandas高效检查列是否包含其他列中的字符串

时间:2015-10-20 19:29:46

标签: python pandas

我试图获取一个布尔索引,表明一列是否包含来自另一列中同一行的字符串:

a      b
boop   beep bop
zorp   zorpfoo
zip    foo zip fa

在检查列b是否包含字符串时,我想得到:

[False, True, True]

现在我正在尝试这种方法,但速度很慢:

df.apply(lambda row: row['a'] in row['b'], axis=1)

这是否有.str方法?

1 个答案:

答案 0 :(得分:2)

df.apply(...,axis = 1)非常慢!你应该避免使用它!

from random import sample
from string import lowercase
from pandas import DataFrame

df = DataFrame({
    'a': map(lambda x: ''.join(sample(lowercase, 2)), range(100000)),
    'b': map(lambda x: ''.join(sample(lowercase, 5)), range(100000))
})

%time map(lambda (x, y): x in y, zip(df['a'], df['b']))

%time df.apply(lambda x: x[0] in x[1], axis=1)