我正在尝试使用Python进行数据科学学习并遇到以下问题。
假设我们有一个
形式的数据框和表格的字典
Regions = {“Central Asia”: [“Afghanistan”],
“Europe”: [“Albania”, “Andorra”],
“Africa”: [“Algeria”],
“America”: [“American Samoa”]}
我想在数据框中创建一个新列,该字典中的键是条目,如下所示:
在Python中有一个很好的方法吗?
感谢您的帮助!!
答案 0 :(得分:7)
您可以将map
与dict
一起使用,其中交换键的值为:
d = {k: oldk for oldk, oldv in Regions.items() for k in oldv}
print (d)
{'Andorra': 'Europe', 'Afghanistan': 'Central Asia',
'Algeria': 'Africa', 'American Samoa': 'America', 'Albania': 'Europe'}
df['Region'] = df['country'].map(d)
print (df)
country Region
0 Afghanistan Central Asia
1 Albania Europe
2 Algeria Africa
3 American Samoa America
4 Andorra Europe
答案 1 :(得分:4)
使用DataFrame.from_dict
和df.stack()
的一个班轮(感谢MaxU!):
In [8]: pd.DataFrame.from_dict(Regions, orient='index').stack()\
.reset_index(level=0)\
.rename(columns={'level_0':'Region',0:'country'})\
.reset_index(drop=True)
Out[8]:
Region country
0 Europe Albania
1 Europe Andorra
2 Africa Algeria
3 Central Asia Afghanistan
4 America American Samoa