我有以下数据框:
df = pd.DataFrame([['Person1', 'CT', 2017],
['Person2', 'FL', 2017],
['Person3', 'TX', 2017],
['Person1', 'TX', 2016]], columns=['Name', 'State', 'Year'])
下面有两个映射表:
state_map = {'CT': 'Connecticut', 'FL': 'Florida', 'TX':'Texas'}
state_map2 = {'CT': 'ABC-CT', 'FL': 'BBC-Florida', 'TX':'CDA-TX'}
以下是数据的样子:
Name State Year
0 Person1 CT 2017
1 Person2 FL 2017
2 Person3 TX 2017
3 Person1 TX 2016
我想找到一种方法来添加一个新列,其中的值使用if条件映射,该条件确定是否使用从state_map或state_map2映射的值。所以如果df [df ['Name'] =='Person1']然后使用state_map,则使用state_map2。
最终输出应如下所示:
Name State Year New_State_Name
0 Person1 CT 2017 Connecticut
1 Person2 FL 2017 BBC-Florida
2 Person3 TX 2017 CDA-TX
3 Person1 TX 2016 Texas
我尝试了以下代码,但它没有用。
df['New_State_Name'] = [state_map[x] if df[df['Name'] == 'Person1'] else
state_map2[x] for x in df['State']]
我收到一条错误消息:
ValueError: The truth value of a DataFrame is ambiguous. Use a.empty,
a.bool(), a.item(), a.any() or a.all().
答案 0 :(得分:2)
使用np.where
:
df['New_State_Name'] = np.where(df['Name']=='Person1',df['State'].map(state_map),df['State'].map(state_map2))
输出:
Name State Year New_State_Name
0 Person1 CT 2017 Connecticut
1 Person2 FL 2017 BBC-Florida
2 Person3 TX 2017 CDA-TX
3 Person1 TX 2016 Texas