如何通过消除重复观察来对数据进行子集化

时间:2014-04-08 04:01:27

标签: r subset

如何删除对IGM的重复观察?我想将以下数据作为每个县的一个IGM。

我试过

    data$GM[data$county]

但它没有用,因为我需要[]内的行号,而不是县号。我怎样才能匹配每个县的一个GM?

要清楚, 我想制作这个数据

   county cd110 repvote   state  GM  gini
2    1001   102       1 Alabama 38.4 0.381
3    1001   102       1 Alabama 38.4 0.381
4    1003   101       0 Alabama 39.6 0.491
5    1003   101       0 Alabama 39.6 0.491
9    1003   101       0 Alabama 39.6 0.491
13   1003   101       1 Alabama 39.6 0.491

以下数据。

  county cd110 repvote   state  GM  gini
   1001   102       1 Alabama 38.4 0.381
   1003   101       0 Alabama 39.6 0.491

谢谢。

1 个答案:

答案 0 :(得分:1)

您可以使用duplicated函数获取每个县的第一个观察结果:

dat[!duplicated(dat$county),]
#   county cd110 repvote   state   GM  gini
# 2   1001   102       1 Alabama 38.4 0.381
# 4   1003   101       0 Alabama 39.6 0.491