我很难理解如何使用tidyr的扩展功能从长到宽的数据格式。假设我有以下数据集:
tst <- data.frame(year = c(2000, 2001, 2002, 2000, 2001, 2002),
site = c("S1", "S1", "S1", "S2", "S2", "S2"),
numbers.one = runif(6), numbers.two = runif(6))
看起来像,
year site numbers.one numbers.two
1 2000 S1 0.8473614 0.40118748
2 2001 S1 0.6581544 0.14398803
3 2002 S1 0.4567127 0.59807617
4 2000 S2 0.4626209 0.02423530
5 2001 S2 0.7317331 0.97254451
6 2002 S2 0.7858409 0.01235655
我想将此格式化为以下格式:
year S1.numbers.one S1.numbers.two S2.numbers.one S2.numbers.two
1 2000 0.8473614 0.40118748 0.4626209 0.02423530
2 2001 0.6581544 0.14398803 0.7317331 0.97254451
3 2002 0.4567127 0.59807617 0.7858409 0.01235655
如果我理解语法,我确定这很简单。 spread(site,numbers.one)为numbers.one值生成S1和S2列,但不生成numbers.two(每年加多行,NAs作为填充),我不知道如何指定多个列到传播。我是否错过了一个步骤,比如先将所有相同的年份聚集在一起然后传播?