我有一个DF,里面有2个int列:“ CNT”和“ STG_TABLE_CNT”。我想添加一个新列“ IS_MATCH”,如果“ CNT”和“ STG_TABLE_CNT”具有相同的值,则返回“ Y”;否则,返回“ N”。
我尝试过:
if result['CNT'] == result['STG_TABLE_CNT']:
result['IS_MATCH'] = 'Y'
else:
result['IS_MATCH'] = 'N'
但这会引发以下错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我意识到它正在寻找相等性(真/假),但我不确定如何解决这个问题,而是返回'Y'或'N'
答案 0 :(得分:1)
result['CNT'] == result['STG_TABLE_CNT']
为您提供了一个完整的系列,pandas
抱怨说它不知道如何将该系列转换为True
或False
。您真正想要的是类似的东西
result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
apply(lambda x: 'Y' if x else 'N')
或
result['IS_MATCH'] = (result['CNT'] == result['STG_TABLE_CNT']).\
map({True: 'Y', False: 'N'})
答案 1 :(得分:1)
使用numpy.where
,它比apply
或itterating
快:
import numpy as np
df['IS_MATCH'] = np.where(result['CNT'].eq(result['STG_TABLE_CNT']), 'Y', 'N')