基于带有查找的if-else条件创建新的pandas dataframe列

时间:2016-07-21 10:25:27

标签: python pandas conditional conditional-statements

我有一个pandas数据帧,我需要根据if-else条件创建一个新列。此问题已多次出现(例如Creating a new column based on if-elif-else condition)。

但是,我无法应用建议的解决方案,因为我还需要在列表中查找值以检查条件。我不能用提出的解决方案做到这一点,因为我不确定如何在外部函数中访问我的查找列表。我的查找列表需要是全局的,我想避免。我觉得应该有更好的方法来做到这一点。

考虑以下数据框df

letters
A
B
C
D
E
F

我还有一个包含查找值的列表:

lookup = [C,D]

现在,我想在我的数据框中创建一个新列,如果相应的值包含在1lookup中,如果值不在0中,则会包含lookup }。

典型的方法是:

df.apply(helper, axis=1)

def helper(row):
  if(row['letters'].isin(lookup)):
     row['result'] = 1
  else:
     row['result'] = 0

但是,我不知道如何在lookup中访问helper()而不将其设为全局。

结果应如下所示:

letters    result
A          0
B          0
C          1
D          1
E          0
F          0

1 个答案:

答案 0 :(得分:1)

虽然这个问题与问题非常相似:How to use pandas apply function on all columns of some rows of data frame

我认为这里值得展示一些方法,在一行上使用np.where使用从isin生成的布尔掩码,isin将返回一个布尔系列任何行都包含列表中的任何匹配项:

In [71]:
lookup = ['C','D']
df['result'] = np.where(df['letters'].isin(lookup), 1, 0)
df

Out[71]:
  letters  result
0       A       0
1       B       0
2       C       1
3       D       1
4       E       0
5       F       0

此处使用2个loc语句并使用~反转掩码:

In [72]:
df.loc[df['letters'].isin(lookup),'result'] = 1
df.loc[~df['letters'].isin(lookup),'result'] = 0
df

Out[72]:
  letters  result
0       A       0
1       B       0
2       C       1
3       D       1
4       E       0
5       F       0