我有这个人。 pandas中的数据框:
df
DAY YEAR REGION VALUE
1 2000 A 12
2 2000 A 10
3 2000 A 13
6 2000 A 15
1 2001 A 3
2 2001 A 40
3 2001 A 83
4 2001 A 95
1 2000 B 124
3 2000 B 102
5 2000 B 131
8 2000 B 150
1 2001 B 30
5 2001 B 4
8 2001 B 8
9 2001 B 12
如何在结果中创建包含YEAR和REGION的唯一组合的新数据框?结果应该是这样的:
YEAR REGION
2000 A
2001 A
2000 B
2001 B
答案 0 :(得分:2)
您可以从df中进行选择,然后拨打drop_duplicates
:
In [16]:
df[['YEAR','REGION']].drop_duplicates()
Out[16]:
YEAR REGION
0 2000 A
4 2001 A
8 2000 B
12 2001 B