如何在R中生成不均匀的数字序列

时间:2015-08-29 03:16:34

标签: r sequence

以下是一个示例数据框:

df <- data.frame(x=c(1,1,2,2,2,3,3,4,5,6,6,6,9,9),y=c(1,2,3,4,6,3,7,8,6,4,3,7,3,2))

我想根据yx组的观察次数生成一系列数字(例如,yx=1有2次观察。我希望序列在每个x组之后不断增加并跳过2。

此示例的所需输出为:

1,2,5,6,7,10,11,14,17,20,21,22,25,26

我怎样才能在R?

中简单地做到这一点

1 个答案:

答案 0 :(得分:2)

要扩展我的评论,分组可以是任意的,您只需要将其重新排序为正确的顺序。有几种方法可以做到这一点,@ krun已经证明这可以使用match函数来完成,或者你可以使用as.numeric函数,如果这对你自己更容易理解。

df <- data.frame(x=c(1,1,2,2,2,3,3,4,5,6,6,6,9,9),y=c(1,2,3,4,6,3,7,8,6,4,3,7,3,2))

# these are equivalent
df$newx <- as.numeric(factor(df$x, levels=unique(df$x)))
df$newx <- match(df$x, unique(df$x))

因为你现在有了一个新的&#34;对于顺序的重新定位,我们可以使用评论中讨论的逻辑。

df$newNumber <- 1:nrow(df) + (df$newx-1)*2

对于此示例,这将产生以下数据帧:

x y newx newNumber
1 1    1         1
1 2    1         2
2 3    2         5
2 4    2         6
2 6    2         7
3 3    3        10
3 7    3        11
4 8    4        14
5 6    5        17
6 4    6        20
6 3    6        21
6 7    6        22
9 3    7        25
9 2    7        26

其中df$newNumber是您想要的输出。

要创建序列0,0,4,4,4,9,...,基本上您正在执行的操作是将每个组中的最小值减去1。最简单的方法是使用library(dplyr)

library(dplyr)
df %>% 
  group_by(x) %>%
  mutate(newNumber2 = min(newNumber) -1)

将有输出:

Source: local data frame [14 x 5]
Groups: x

   x y newx newNumber newNumber2
1  1 1    1         1          0
2  1 2    1         2          0
3  2 3    2         5          4
4  2 4    2         6          4
5  2 6    2         7          4
6  3 3    3        10          9
7  3 7    3        11          9
8  4 8    4        14         13
9  5 6    5        17         16
10 6 4    6        20         19
11 6 3    6        21         19
12 6 7    6        22         19
13 9 3    7        25         24
14 9 2    7        26         24