qplot()中可能存在不一致的行为?

时间:2010-07-28 16:29:05

标签: r ggplot2 statistics

我正在尝试使用qplot()绘制一个简单的时间序列,就像使用plot()一样。 x变量为.POSIXlt,y只是一些连续测量。这是代码和一些简短的评论。关于为什么这些data.frames表现不同的任何帮助都将非常感激。正如你在下面看到的,我可以解决这个问题,但我很好奇为什么不能像我期望的那样工作。

一些细节:
平台:OS X 10.6.4
R版本:R 2.11.0

免责声明:我意识到我可以深入研究源代码并自己解决这个问题。我从未使用过SO,并认为这可能是这个论坛的一个很好的主题。

免责声明(2):我是ggplot2的新手

library(ggplot2)
ws.dat <- read.csv("~/path/to/filename.csv",header=F)
names(ws.dat) <- c("s","t","w")
ws.dat$new.t <- as.POSIXlt(ws.dat$t)
ws.dat[1:5,]
  ##       s                   t    w               new.t
  ## 1 29522 2005-07-02 00:00:00 5.00 2005-07-02 00:00:00
  ## 2 29522 2005-07-02 00:10:00 5.29 2005-07-02 00:10:00
  ## 3 29522 2005-07-02 00:20:00 5.48 2005-07-02 00:20:00
  ## 4 29522 2005-07-02 00:30:00 5.54 2005-07-02 00:30:00
  ## 5 29522 2005-07-02 00:40:00 5.49 2005-07-02 00:40:00


## the following works
plot(as.POSIXlt(ws.dat$t), ws.dat$w)

## doesn't work
qplot(as.POSIXlt(t), w, data = ws.dat)
  ## Error in if (length(range) == 1 || diff(range) == 0) { : 
  ## missing value where TRUE/FALSE needed

## doesn't work
ws.dat$new.t <- as.POSIXlt(ws.dat$t)
qplot(new.t, w, data = ws.dat)
  ## Same error as above

## Note - I could find a more elegant way of doing this; I'm just trying
##   to reproduce as fast as possible.
new.df <- data.frame(ws.dat$new.t, ws.dat$w)
new.df[1:5,]
  ##          ws.dat.new.t ws.dat.w
  ## 1 2005-07-02 00:00:00     5.00
  ## 2 2005-07-02 00:10:00     5.29
  ## 3 2005-07-02 00:20:00     5.48
  ## 4 2005-07-02 00:30:00     5.54
  ## 5 2005-07-02 00:40:00     5.49

## 'works as *I* would expect'; this is != 'works *as* expected' 
qplot(ws.dat.new.t, ws.dat.w, data = new.df)

2 个答案:

答案 0 :(得分:2)

使用POSIXct - POSIXlt不适合包含在数据框中。当您使用data.frame创建变量时,它会自动强制转换为POSIXct

答案 1 :(得分:1)

如果有疑问,请查看传递的对象的类别!谢谢哈德利。

class(new.df$ws.dat.new.t)
## [1] "POSIXt"  "POSIXct"  <--- ct!!!!
class(as.POSIXlt(ws.dat$tt))
## [1] "POSIXt"  "POSIXlt"  <--- lt!!!!