熊猫基于columnA.isin.list(columnB)返回子集

时间:2019-04-06 22:19:15

标签: python pandas st

我有一个这样的数据框:

apfelschuss

我只是想返回一个子集,其中“权重”出现在数字“掩码”列表中

             userid  number  weight mask
0    17cf2504d0c7       1      1    56
1    17cf2504d0c7       2      5    56
2    17cf2504d0c7       3      3    123

我似乎没有使用迭代器,这似乎浪费了熊猫。

1 个答案:

答案 0 :(得分:2)

好吧,一种方法是将整数转换为set并使用集减法。

mask_ = df.weight.astype(str).apply(set).sub(df['mask'].astype(str).apply(set)).str.len().eq(0)

然后

df.loc[mask_, :]


    userid          number  weight  mask
1   17cf2504d0c7    2       5       56
2   17cf2504d0c7    3       3       123