我想使用R来简化和子化大型数据集(超过100 000个值),然后绘制它们。下面是我的数据集的简化版本(图1),我把它分解为三年和两种作物类型。我有一年(2011-2013),两种作物类型(玉米和大豆)及其总面积。
我希望将数据按年分配到玉米和大豆的总面积中,并将其分为年份,类型和总面积的新表格(示例图2),然后绘制每年的总面积(示例情节)在图3)中。
图1小样本数据集
图2新总表
图3我想要生成的图表示例
我认为我可以按年度对数据进行子集化并使用
进行裁剪corn2011< - subset(CropTable,Year == 2011& Lulc ==“Corn”)
corn2012< - subset(CropTable,Year == 2012& Lulc ==“Corn”)
然后我可以使用sum函数
来汇总数据和(corn2011 [1,3]),
但是我不确定如何每年绘制它们或相互对立以使它看起来像图3。
答案 0 :(得分:1)
对于你的情节,你可以试试这个
data.df <- read.table(text="
Year Type Area
1 2011 corn 30
2 2012 corn 15
3 2013 corn 50
4 2011 Soy 45
5 2012 Soy 30
6 2013 Soy 60",
header = TRUE)
ggplot(data=data.df, aes(x=as.factor(Year), y=Area, group=Type, color=Type)) + geom_line() + xlab("Year") + ylab("Area (ha)") + theme_bw() + scale_color_manual(values=c("red", "blue"))