我有以下数据显示一些数字,按年和月分类(最近的情况恰好是第一次,但这不是问题)。
是否(在R中)有一种方法可以轻松地反转枢轴表"进入一个有两列的数据框,"数据"和"价值"?当然,我可以编写一个小程序来完成它(或者,在这种情况下,几分钟的手工工作就可以了:删除标签,将所有内容放在一行中,而不是在Excel中粘贴长行并填写填写系列的时间戳),但我很好奇这是否可以在R中本地完成,因为它将来会有用。
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2002 315 45 397 750 380 343 794 110 777 323 746 735
2003 748 711 315 395 726 359 799 138 719 345 787 772
2004 109 776 764 738 384 368 396 700 384 398 340 781
2005 747 720 191 938 188 135 185 177 753 733 313 399
2006 726 316 713 135 103 794 751 165 348 701 798 128
2007 763 123 276 111 150 145 163 226 248 950 917 879
2008 167 873 775 130 184 780 444 115 107 325 781 701
2009 897 143 805 104 743 158 113 727 755 764 394 710
2010 349 743 180 762 359 744 102 775 109 178 369 799
2011 746 706 800 737 786 194 195 105 101 784 795 142
2012 124 794 141 126 284 207 877 803 832 175 140 763
2013 796 100 896 119 810 134 100 183 792 185 743 792
答案 0 :(得分:2)
有很多方法可以做到这一点。在香草R中,这是一种方式:
首先,让我们将您的数据读入一个数据框(您可能会使用read.csv
,但我会将您的桌面复制到一起,所以我使用这种方法) :
mytable=read.table(stdin(),header=TRUE,row.names=1)
0: Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1: 2002 315 45 397 750 380 343 794 110 777 323 746 735
2: 2003 748 711 315 395 726 359 799 138 719 345 787 772
3: 2004 109 776 764 738 384 368 396 700 384 398 340 781
4: 2005 747 720 191 938 188 135 185 177 753 733 313 399
5: 2006 726 316 713 135 103 794 751 165 348 701 798 128
6: 2007 763 123 276 111 150 145 163 226 248 950 917 879
7: 2008 167 873 775 130 184 780 444 115 107 325 781 701
8: 2009 897 143 805 104 743 158 113 727 755 764 394 710
9: 2010 349 743 180 762 359 744 102 775 109 178 369 799
10: 2011 746 706 800 737 786 194 195 105 101 784 795 142
11: 2012 124 794 141 126 284 207 877 803 832 175 140 763
12: 2013 796 100 896 119 810 134 100 183 792 185 743 792
13:
df1=stack(mytable)
mydf=data.frame(value=df1$values,month=df1$ind,
year=factor(rownames(mytable))[row(mytable)])
head(mydf)
value month year
1 315 Jan 2002
2 748 Jan 2003
3 109 Jan 2004
4 747 Jan 2005
5 726 Jan 2006
6 763 Jan 2007
仍然可能有更高效的方法,并且包中有许多功能可以使这类任务变得简单,但是做这样的事情并不难。
答案 1 :(得分:0)
使用stats:::reshape
你可以走很长的路(弄清楚如何正确命名月份)。您的问题类似于this one。
> reshape(x, direction = "long", varying = list(2:ncol(x)), idvar = "Year")
Year time Jan
2002.1 2002 1 315
2003.1 2003 1 748
2004.1 2004 1 109
2005.1 2005 1 747
2006.1 2006 1 726
2007.1 2007 1 763
另一种选择是使用包reshape2
。
> library(reshape2)
> melt(x, id.vars = "Year")
Year variable value
1 2002 Jan 315
2 2003 Jan 748
3 2004 Jan 109
4 2005 Jan 747
5 2006 Jan 726
6 2007 Jan 763
7 2008 Jan 167
答案 2 :(得分:0)
我尝试使用最能回答问题的答案,但是即使我的数据形状相同,它也对我不起作用。我发现这种更简单的方法:
使用软件包tidyr:
mydf1 <- data.frame(mydata %>%
pivot_longer(-year, names_to = "month", values_to = "value"))
有关更多信息和更复杂的转换,请参见: https://tidyr.tidyverse.org/reference/pivot_longer.html