从pandas数据帧

时间:2016-01-05 18:29:25

标签: python pandas dataframe

我有这个人。 pandas中的数据框:

df

DAY   YEAR    REGION   VALUE
  1   2000     A         12
  2   2000     A         10
  3   2000     A         13
  6   2000     A         15
  1   2001     A         3
  2   2001     A         40
  3   2001     A         83
  4   2001     A         95
  1   2000     B         124
  3   2000     B         102
  5   2000     B         131
  8   2000     B         150
  1   2001     B         30
  5   2001     B         4
  8   2001     B         8
  9   2001     B         12

如何在结果中创建包含YEAR和REGION的唯一组合的新数据框?结果应该是这样的:

YEAR   REGION
2000    A
2001    A
2000    B
2001    B

1 个答案:

答案 0 :(得分:2)

您可以从df中进行选择,然后拨打drop_duplicates

In [16]:
df[['YEAR','REGION']].drop_duplicates()

Out[16]:
    YEAR REGION
0   2000      A
4   2001      A
8   2000      B
12  2001      B