构建数据框/数据表的有效方法

时间:2015-03-23 02:59:31

标签: r dataframe data.table

我有一个data.frame,用于设置模拟参数。

states_grid <- expand.grid(years = c(1:47), start_pct = c(0:99), sim_num = c(1:50))

上面的代码创建了我想要模拟的所有状态。我的问题是创建一个data.frame来保存输出。我想要做的是创建一个更大的数据框,我们在其中添加一个ob_num变量。 ob_num变量将从1运行到第1列中指示的年数。

例如:

   years start_pct sim_num ob_num
1:     2        99       1      1
2:     2        99       1      2
3:     3        99       1      1
4:     3        99       1      2
5:     3        99       1      3
6:     4        99       1      1
7:     4        99       1      2
8:     4        99       1      3
9:     4        99       1      4

但是我想不出创建这个数据框的有效方法。

思想?

编辑:我尝试了以下建议,但似乎没有这样做。

以下代码返回相同大小(235,000)行的data.table。

states_grid <- expand.grid(years = c(1:(year_max - year_min + 1)),
                           start_pct = c(0:99),
                           sim_num = c(1:50))
states_grid <- data.table(states_grid)
setDT(states_grid)[, ob_num := 1:.N, by = years][]

我也尝试过:

states_grid <- setDT(states_grid)[, ob_num := 1:.N, by = years][]

两种方法都返回235K行。

1 个答案:

答案 0 :(得分:1)

CJ(years = c(1:47), start_pct = c(0:99), sim_num = c(1:50))[,
   .(ob_num = seq_len(years)), by = .(years, start_pct, sim_num)]
#         years start_pct sim_num ob_num
#      1:     1         0       1      1
#      2:     1         0       2      1
#      3:     1         0       3      1
#      4:     1         0       4      1
#      5:     1         0       5      1
#     ---                               
#5639996:    47        99      50     43
#5639997:    47        99      50     44
#5639998:    47        99      50     45
#5639999:    47        99      50     46
#5640000:    47        99      50     47