在熊猫系列和给定列表的行(单词列表)之间查找匹配的元素

时间:2019-03-19 15:33:35

标签: python pandas numpy vectorization

我有一个熊猫系列,其中每一行都是单词列表。 Example Series

我有一个单词列表,例如 my_list = ['ball','apple']。我想用该行和 my_list 中出现的单词替换该系列的所有行。最快的方法是什么?向量化可以用于此类任务吗?

我希望结果如下:Desired Output

1 个答案:

答案 0 :(得分:0)

尝试一下:

df = pd.DataFrame({'col1':[['apple','ball','cat'],['cat','donkey'],['elephant','apple','rhino']]}, index=[0,1,2])

my_list = ['ball', 'apple']

pd.Series([[r for r in i if r in my_list] for i in df['col1']])

输出:

0    [apple, ball]
1               []
2          [apple]
dtype: object