我已经为每个垃圾箱指定了累计计数的数据。示例中文件的前两列是变量,稍后将用作ggplot()
函数中的aestetics变量。下一列是两个箱的一些值(Sb,Ss)及其每一行的计数(整数Nb,Ns)(通常可以存在两个以上的箱)。
continent,location,Ns,Ss,Nb,Sb
Australia,forest,13,191.2,5,420
Australia,lagoon, 19,150,7,300
Europe,forest,13,95,10,215
Europe,lagoon,32,130,17,205
EDT 我需要将数据融合成长格式,将两列与Si("尺寸")粘合在一起,并将两列与Ni("数字")分开。也就是说,会有两个新变量:" size"和"计数"来自(Sb,Ss,Nb,Ns)(前两列保持不变):
continent,location,size,counts
Australia,forest,191.2,13
Australia,forest,420,5
Australia,lagoon,150,19
Australia,lagoon,300,7
Europe,forest,95,13
Europe,forest,215,10
Europe,lagoon,130,21
Europe,lagoon,205,17
来自gather()
包的功能tidyr
仅产生"键"和"价值"选项,因此它只能获取最后四列中的所有值,并使用相应的字母(以前的变量名称)Ss,Sb等逐个标记它们。
答案 0 :(得分:1)
老实说,我不知道你真正想要做什么,但是可以使用dplyr的spread()和gather()命令将数据从wide转换为long。谷歌应该指导你。