在Pandas DataFrame中比较2列并填充第3列

时间:2019-04-09 17:57:50

标签: python pandas

我有一个DF,里面有2个int列:“ CNT”和“ STG_TABLE_CNT”。我想添加一个新列“ IS_MATCH”,如果“ CNT”和“ STG_TABLE_CNT”具有相同的值,则返回“ Y”;否则,返回“ N”。

我尝试过:

if result['CNT'] == result['STG_TABLE_CNT']:
    result['IS_MATCH'] = 'Y'
else:
    result['IS_MATCH'] = 'N'

但这会引发以下错误:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我意识到它正在寻找相等性(真/假),但我不确定如何解决这个问题,而是返回'Y'或'N'

2 个答案:

答案 0 :(得分:1)

result['CNT'] == result['STG_TABLE_CNT']为您提供了一个完整的系列,pandas抱怨说它不知道如何将该系列转换为TrueFalse。您真正想要的是类似的东西

result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
                         apply(lambda x: 'Y' if x else 'N')

result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
                         map({True: 'Y', False: 'N'})

答案 1 :(得分:1)

使用numpy.where,它比applyitterating快:

import numpy as np

df['IS_MATCH'] = np.where(result['CNT'].eq(result['STG_TABLE_CNT']), 'Y', 'N')