汇总和交叉制作数据的问题

时间:2017-03-21 15:05:23

标签: r aggregate crosstab

我的数据看起来像这样,有大约3300行数据:

Year     Location     Catch
1991       0313       45100
1989       0711         323
1991       0312        1100
1991       0313       45100
1989       0711         323
1991       0312         400 
1990       0313      101000
1981       0711         623
1999       0312         410
2000       0313      145100
1987       0711         323
1987       1285         770  
....

年份涵盖1977 - 2015年期间,大约有500个不同的地点,并非每年都有数据。

我需要这样的输出,总结每个单元格的捕获量,按位置(行)和年份(列)列表:

Location   '1977' '1978' '1979' '1980' '1981' '1982' '1983' ...
0312         456  11100  12560    320   4566      0  12010  ...
0313         121    100   4500    760    112  12050 100100  ...
0711        5500   6500      0   1205   1201    560  90500  ...
0712         325    215    600  10100      0   4500  11050  ...
1285       10005   2700   1900 101000     50   7500   6050  ...
...          ...    ...    ...    ...    ...    ...    ...

之前我曾问过类似的问题,我已经尝试过成功解决该问题的不同版本的解决方案,但没有成功。这有点不同,稍微复杂一些,我的错误。

感谢任何帮助。

2 个答案:

答案 0 :(得分:5)

您可以使用xtabs来实现您所寻找的目标,在下面,您可以计算您在答案中发布的表格中每个地点的总和。

xtabs(Catch ~ Location + Year, df)
        Year
Location   1981   1987   1989   1990   1991   1999   2000
    312       0      0      0      0   1500    410      0
    313       0      0      0 101000  90200      0 145100
    711     623    323    646      0      0      0      0
    1285      0    770      0      0      0      0      0

数据

df <- read.table(header=TRUE, text="Year     Location     Catch
1991       0313       45100
1989       0711         323
1991       0312        1100
1991       0313       45100
1989       0711         323
1991       0312         400 
1990       0313      101000
1981       0711         623
1999       0312         410
2000       0313      145100
1987       0711         323
1987       1285         770 ")

答案 1 :(得分:1)

这是一种-SecondParam方式。按照&#39;年&#39;,&#39;位置&#39;进行分组后,获取&#39; Catch&#39;的tidyverse然后sum来自&#39; long&#39;广泛的&#39;格式

spread