如何按键重新创建表格?

时间:2015-12-04 19:15:43

标签: r data.table

我认为这可能是一个非常简单的问题,但我真的是R的新手。

我有一个带有密钥和许多行的data.table,其中两行可以设置为密钥。我想通过Key重新创建表。

例如,简单的数据。在这种情况下,密钥为IDAct,此处我们总共可以获得4个组。

ID  ValueDate Act Volume
1 2015-01-01 EUR     21
1 2015-02-01 EUR     22
1 2015-01-01 MAD     12
1 2015-02-01 MAD     11
2 2015-01-01 EUR      5
2 2015-02-01 EUR      7
3 2015-01-01 EUR      4
3 2015-02-01 EUR      2
3 2015-03-01 EUR      6

以下是生成测试数据的代码:

dd <- data.table(ID = c(1,1,1,1,2,2,3,3,3), 
             ValueDate = c("2015-01-01", "2015-02-01", "2015-01-01","2015-02-01", "2015-01-01","2015-02-01","2015-01-01","2015-02-01","2015-03-01"),
             Act = c("EUR","EUR","MAD","MAD","EUR","EUR","EUR","EUR","EUR"),
             Volume=c(21,22,12,11,5,7,4,2,6))

更改后,每列应显示一个由Key(IDAct)定义的特定组。

结果如下:

 ValueDate ID1_EUR D1_MAD D2_EUR D3_EUR
 2015-01-01      21     12      5      4
 2015-02-01      22     11      7      2
 2015-03-01      NA     NA     NA      6

非常感谢!

1 个答案:

答案 0 :(得分:6)

您要做的不是重新创建data.table,而是将其从长格式重新整理为宽格式。您可以使用dcast

dcast(dd, ValueDate ~ ID + Act, value.var = "Volume")

给出:

    ValueDate 1_EUR 1_MAD 2_EUR 3_EUR
1: 2015-01-01    21    12     5     4
2: 2015-02-01    22    11     7     2
3: 2015-03-01    NA    NA    NA     6

如果您希望结果列中的数字前面带有ID,那么您可以使用:

dcast(dd, ValueDate ~ paste0("ID",ID) + Act, value.var = "Volume")

给出:

    ValueDate ID1_EUR ID1_MAD ID2_EUR ID3_EUR
1: 2015-01-01      21      12       5       4
2: 2015-02-01      22      11       7       2
3: 2015-03-01      NA      NA      NA       6