检查pandas数据帧中的列值是否存在于系列中

时间:2017-08-16 23:39:20

标签: python pandas

我有一个看起来像这样的Pandas DataFrame:

>>>df
  Application ID     Name 
0          12         Sally   
1          32         Bill   
2          35         Dave   
3          11         Positivus   
4          09         Milan   

一系列看起来像这样的

 >>> skype_list
0                                 Milan
1                                 Sally
2                                 Greg
3                                 Jim
4                                 Positivus

我想循环遍历df.Name并创建一个列,如果名称在skype_list中,则为1,如果不在,则为0。结果应如下所示:

>>>df
      Application ID     Name         skype
    0          12         Sally        1
    1          32         Bill         0
    2          35         Dave         0
    3          11         Positivus    1
    4          09         Milan        1

现在我正试图建立一个这样的循环:

for x in df.Name:
    if x in skype_list:
        df['skype'].append(1)
    else:
        df['skype'].append(0)

2 个答案:

答案 0 :(得分:5)

或者您可以使用isin

df['skype'] = df.Name.isin(skype_list).astype(int)

df    
# Application   ID       Name   skype
#0          0   12      Sally       1
#1          1   32       Bill       0
#2          2   35       Dave       0
#3          3   11  Positivus       1
#4          4   9       Milan       1

答案 1 :(得分:2)

这里有一个愚蠢的解决方案:

skype_names = set(skype_list.values)
df['skype'] = df.Name.apply(lambda x: x in skype_names).astype(int)