通过绘制多个组,区域和小时的小时数据来创建多个折线图。相同data.frame的来源?

时间:2015-02-09 20:36:29

标签: r graph plot ggplot2

我正在尝试使用R中的单个或最小命令创建多个图[一次或多个6个图形]。

让我们先看看小时数据: -

 str(ZZZ)
'data.frame':   291960 obs. of  9 variables:
 $ TRADE_DT  : POSIXct, format: "2014-11-01" "2014-11-01" "2014-11-01" "2014-11-01" ...
 $ YEAR      : int  2014 2014 2014 2014 2014 2014 2014 2014 2014 2014 ...
 $ MONTH     : int  11 11 11 11 11 11 11 11 11 11 ...
 $ hour_num  : int  1 1 1 1 1 1 1 1 1 1 ...
 $ source    : Factor w/ 5 levels "AB","EF","EI",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ LSE_CD    : int  116 116 116 116 116 116 135 135 135 135 ...
 $ utility_cd: Factor w/ 6 levels "CPL","SHARY",..: 1 2 3 4 5 6 1 4 5 6 ...
 $ load      : num  12.834 0.502 31.436 13.948 31.314 ...
 $ total_load: num  13.929 0.524 35.864 14.77 33.161 ...

dput(头(ZZZ))

structure(list(TRADE_DT = structure(c(1414818000, 1414818000, 
1414818000, 1414818000, 1414818000, 1414818000), class = c("POSIXct", 
"POSIXt"), tzone = ""), YEAR = c(2014L, 2014L, 2014L, 2014L, 
2014L, 2014L), MONTH = c(11L, 11L, 11L, 11L, 11L, 11L), hour_num = c(1L, 
1L, 1L, 1L, 1L, 1L), source = structure(c(1L, 1L, 1L, 1L, 1L, 
1L), .Label = c("AB", "EF", "EI", "IB", "ST"), class = "factor"), 
LSE_CD = c(116L, 116L, 116L, 116L, 116L, 116L), utility_cd = structure(1:6,       .Label = c("CPL", 
"SHARY", "TNMP", "TXRL", "TXTU", "WTU"), class = "factor"), 
load = c(12.83423, 0.501589, 31.435567, 13.947688, 31.314148, 
2.237439), total_load = c(13.928702, 0.524432, 35.864181, 
14.770245, 33.161105, 2.417721)), .Names = c("TRADE_DT", 
"YEAR", "MONTH", "hour_num", "source", "LSE_CD", "utility_cd", 
"load", "total_load"), row.names = c(NA, 6L), class = "data.frame")

我有兴趣根据每个实用程序覆盖我的来源(AB,EI,EF等......)。对于6个实用程序,它应该生成6个图形,其中每个图形将有5行(或者根据需要为2或3)。每个实用程序&的 1图表每个图表应该有多个基于来源的行。 听起来很简单,但是当数据采用这种格式时,我无法实现这一目标。

我能够在图表中叠加多行......

然而,当我将我的信号源(5个因素)变成5个不同的列时,我能够将其拉下来并将图片中的HVER移除。每天总结。

STR(YYY)

'data.frame':   102 obs. of  5 variables:
 $ TRADE_DT: POSIXct, format: "2014-01-01" "2014-01-02" "2014-01-03" ...
 $ AB      : num  289 336 356 258 316 ...
 $ EI      : num  306 347 370 282 335 ...
 $ IB      : num  282 325 299 250 307 ...
 $ EF      : num  304 348 367 281 335 ...

ggplot(YYY, aes(TRADE_DT)) + 
  geom_line(aes(y = AB, colour = "AB")) + 
  geom_line(aes(y = EI, colour = "EI")) +
  geom_line(aes(y = IB, colour = "IB")) +
  geom_line(aes(y = EF, colour = "EF")) 

但是,上面的方法并没有像我想要的那样用utility_cd或LSE_cd分隔图形,而且我不得不摆脱小时。我看到人们使用"命令"在SAS中同时创建这些多个图表。

是否有一个神奇的"命令"在R这种类型的交易?我将把我的所有图表输出到一个大的pdf中,我可以自己处理。

如果有人可以分享用这些标准生成多个图表的秘密,我真的很感激。此外,当我有24小时数据时,线条看起来不像线条,它们看起来像是通过倾斜的水平线相互连接。

再次感谢!

最佳, Gyve

1 个答案:

答案 0 :(得分:1)

请提供dput(head(YOUR DATA SET))而不是str,因为str不能很好地重现您的数据。 How to make a great R reproducible example?

希望我这有帮助:
1。绘制数据 对于ggplot,您需要 reshape2 -package

的措辞中的熔合数据集

采取第二个数据集:

YYY <- data.frame(TRADE_DT = seq(as.Date("2014-01-01"),as.Date("2014-01-05"), length.out = 5),
           AB = c(289,336,356,258,316),
           EI = c(306,347,370,282,335),
           IB = c(282,325,299,250,307),
           EF = c(304,348,367,281,335))

现在我们使用melt来满足我们的需求:

require(reshape2)
YYY_molten <- melt(YYY,"TRADE_DT")
> head(YYY_molten)
    TRADE_DT variable value
1 2014-01-01       AB   289
2 2014-01-02       AB   336
3 2014-01-03       AB   356
4 2014-01-04       AB   258
5 2014-01-05       AB   316
6 2014-01-01       EI   306

现在您可以使用ggplot

require(ggplot2)
ggplot(YYY_molten, aes(x = TRADE_DT, y = value, col = variable)) + geom_line()

<强> 2。按效用绘图
假设_utility_cd_是包含实用程序数据的列,您可以执行以下操作:

ZZZ_split <- split(ZZZ, f = ZZZ$utility_cd)
lapply(ZZZ_split, function(subset){
  # function that melts and plots your subset/utility
})

如果我解释你的str,它应该是:

lapply(ZZZ_split, function(subset){
  print(ggplot(subset, aes(x=TRADE_DT, y=LSE_CD, col = source)) + geom_line())
})