如何根据另一列中的值将函数应用于Pandas中的列?

时间:2017-01-31 22:15:21

标签: python pandas numpy apply

提前感谢您阅读。

我有一个数据框:

df = pd.DataFrame({'Words':[{'Sec': ['level']},{'Sec': ['levels']},{'Sec': ['level']},{'Und': ['ba ']},{'Pro': ['conf'],'ProAbb': ['cth']}],'Conflict':[None,None,None,None,'Match Conflict']})


         Conflict                                     Words
0            None                      {u'Sec': [u'level']}
1            None                     {u'Sec': [u'levels']}
2            None                      {u'Sec': [u'level']}
3            None                        {u'Und': [u'ba ']}
4  Match Conflict  {u'ProAbb': [u'cth'], u'Pro': [u'conf']}

我想应用一个例程,对于'Words'中的每个元素,检查是否Conflict = 'Match Conflict',如果是,则将一些函数应用于'Words'中的值。

例如,使用以下占位符函数:

def func(x):
    x = x.clear()
    return x

我写道:

df['Words'] = df[df['Conflict'] == 'Match Conflict']['Words'].apply(lambda x: func(x))

我的预期输出是:

         Conflict                                     Words
0            None                      {u'Sec': [u'level']}
1            None                     {u'Sec': [u'levels']}
2            None                      {u'Sec': [u'level']}
3            None                        {u'Und': [u'ba ']}
4  Match Conflict                                        None

相反,我得到:

         Conflict Words
0            None   NaN
1            None   NaN
2            None   NaN
3            None   NaN
4  Match Conflict  None

该函数仅应用于具有Conflict = 'Match Conflict'的行,但代价是其他行(全部变为None。我假设其他行未被触及;显然这不是案件。

您是否可以解释如何在不删除Words列中的所有信息的情况下实现所需的输出?我相信答案可能在np.where,但我无法做到这一点,这是我能想到的最好的。

任何帮助非常感谢。感谢。

4 个答案:

答案 0 :(得分:3)

您应该重写该函数以使用所有行:

def func(x, match):
    if x['Conflict'] == match:
        return None
    return x['Words']

df['Words'] = df.apply(lambda row: func(row, 'Match Conflict'), axis=1)

答案 1 :(得分:3)

您可以尝试仅使用.loc更新符合条件的行:

df.loc[df['Conflict'] == 'Match Conflict', 'Words'] = df.loc[df['Conflict'] == 'Match Conflict', 'Words'].apply(lambda x: func(x))

enter image description here

答案 2 :(得分:2)

如您所述,您也可以使用where

condition = df.Conflict != 'Match Conflict'
df['Words'] = df.Words.where(condition, None)

         Conflict                  Words
0            None   {u'Sec': [u'level']}
1            None  {u'Sec': [u'levels']}
2            None   {u'Sec': [u'level']}
3            None     {u'Und': [u'ba ']}
4  Match Conflict                   None

答案 3 :(得分:2)

假设占位符

def func(x):
    x = x.clear()
    return x

然后我们可以使用布尔索引并应用以获得所需的输出。

df.ix[df['Conflict']=='Match Conflict', 'Words'].apply(func)

我想提供一个简洁的单行,但我来不及:(