我的数据看起来像这样,有大约3300行数据:
Year Location Catch
1991 0313 45100
1989 0711 323
1991 0312 1100
1991 0313 45100
1989 0711 323
1991 0312 400
1990 0313 101000
1981 0711 623
1999 0312 410
2000 0313 145100
1987 0711 323
1987 1285 770
....
年份涵盖1977 - 2015年期间,大约有500个不同的地点,并非每年都有数据。
我需要这样的输出,总结每个单元格的捕获量,按位置(行)和年份(列)列表:
Location '1977' '1978' '1979' '1980' '1981' '1982' '1983' ...
0312 456 11100 12560 320 4566 0 12010 ...
0313 121 100 4500 760 112 12050 100100 ...
0711 5500 6500 0 1205 1201 560 90500 ...
0712 325 215 600 10100 0 4500 11050 ...
1285 10005 2700 1900 101000 50 7500 6050 ...
... ... ... ... ... ... ... ...
之前我曾问过类似的问题,我已经尝试过成功解决该问题的不同版本的解决方案,但没有成功。这有点不同,稍微复杂一些,我的错误。
感谢任何帮助。
答案 0 :(得分:5)
您可以使用xtabs
来实现您所寻找的目标,在下面,您可以计算您在答案中发布的表格中每个地点的总和。
xtabs(Catch ~ Location + Year, df)
Year
Location 1981 1987 1989 1990 1991 1999 2000
312 0 0 0 0 1500 410 0
313 0 0 0 101000 90200 0 145100
711 623 323 646 0 0 0 0
1285 0 770 0 0 0 0 0
数据强>
df <- read.table(header=TRUE, text="Year Location Catch
1991 0313 45100
1989 0711 323
1991 0312 1100
1991 0313 45100
1989 0711 323
1991 0312 400
1990 0313 101000
1981 0711 623
1999 0312 410
2000 0313 145100
1987 0711 323
1987 1285 770 ")
答案 1 :(得分:1)
这是一种-SecondParam
方式。按照&#39;年&#39;,&#39;位置&#39;进行分组后,获取&#39; Catch&#39;的tidyverse
然后sum
来自&#39; long&#39;广泛的&#39;格式
spread