如何在其他两个列中的值都在字典中的条件下运行pd DataFrame并创建一个新列?
我有一本包含客户ID和他们从中购买的连锁店的字典。我想遍历df的每一行,检查id和该行的链是否在dict中,然后根据该条件为新列分配一个值。
for index, row in merged_dataset.iterrows():
# check if customer id is in dict
if str(row.id) in id_chain.keys():
# check if chain is in dict
if str(row.chain) in id_chain[str(row.id)]:
# create new feature
row['has_bought_brand'] = 1
else:
row['has_bought_brand'] = 0
return merged_dataset
现在的结果是“ has_bought_brand”列未保存在merged_dataset中。