时间戳上的reshape2融化函数给出了NA

时间:2017-01-19 08:08:12

标签: r timestamp reshape2

我正在尝试使用reshape2 melt函数来融合数据框,以便使用ggplot2绘制我的数据集。但是,对于包含时间戳的我的引用列,它在第一次迭代后给我NA(每个时间戳正确显示一次,然后我有这些NA s。)

这是我的数据集:

TIMESTAMP,RECNUM,Tair,Tground
2015-01-06 16:27,1,5.0,7.0
2015-01-06 16:28,2,6.0,7.0
2015-01-06 16:29,3,6.0,7.0
2015-01-06 16:30,4,6.5,7.0
2015-01-06 16:31,5,6.8,7.1
2015-01-06 16:32,6,6.8,7.1
2015-01-06 16:33,7,6.8,7.12
2015-01-06 16:34,8,7.1,7.1
2015-01-06 16:35,9,7.15,7.09
2015-01-06 16:36,10,7.18,7.1
2015-01-06 16:37,11,7.3,7.1

我的R代码:

library(ggplot2)
library(reshape2)
datafile <- file.choose()
dat <- read.csv(datafile)
dat$TIMESTAMP <- as.POSIXlt(strptime(dat$TIMESTAMP,"%Y-%m-%d %H:%M"))
meltedData = melt(dat, id.vars=c("RECNUM", "TIMESTAMP"), variable.name="Measure")

结果meltedData变量:

> meltedData
   RECNUM           TIMESTAMP Measure value
1       1 2015-01-06 16:27:00    Tair  5.00
2       2 2015-01-06 16:28:00    Tair  6.00
3       3 2015-01-06 16:29:00    Tair  6.00
4       4 2015-01-06 16:30:00    Tair  6.50
5       5 2015-01-06 16:31:00    Tair  6.80
6       6 2015-01-06 16:32:00    Tair  6.80
7       7 2015-01-06 16:33:00    Tair  6.80
8       8 2015-01-06 16:34:00    Tair  7.10
9       9 2015-01-06 16:35:00    Tair  7.15
10     10 2015-01-06 16:36:00    Tair  7.18
11     11 2015-01-06 16:37:00    Tair  7.30
12      1                <NA> Tground  7.00
13      2                <NA> Tground  7.00
14      3                <NA> Tground  7.00
15      4                <NA> Tground  7.00
16      5                <NA> Tground  7.10
17      6                <NA> Tground  7.10
18      7                <NA> Tground  7.12
19      8                <NA> Tground  7.10
20      9                <NA> Tground  7.09
21     10                <NA> Tground  7.10
22     11                <NA> Tground  7.10

我做错了什么?有没有办法让所有表都有合适的时间戳?

谢谢,

学家

修改 这个问题与this one不同,因为我的问题不在于如何使用reshape2来改变宽度到长度,而是为什么reshape2::melt在时间戳上给我NA。< / p>

1 个答案:

答案 0 :(得分:1)

您的代码出现问题的原因是您已将TIMESTAMP列强制转换为POSIXlt。请注意,POSIXltPOSIXct虽然与外部非常相似,但却有所不同。 POSIXlt实际上是一个列表。试试例如:

x<-as.POSIXlt("2017-01-15 15:00:00")
typeof(x)
#[1] "list"
unclass(x)
#$sec
#[1] 0
#$min
#[1] 0
#$hour
#[1] 15
#$mday
#[1] 15
#...

如您所见,POSIXlt对象是list,其元素表示日期的秒,分,小时等。让我们POSIXct

x<-as.POSIXct("2017-01-15 15:00:00")
typeof(x)
#[1] "double"
unclass(x)
#[1] 1484488800
#attr(,"tzone")
#[1] ""
另一方面,

POSIXct只是UNIX纪元的秒数​​,所以日期只能存储为一个数字。 POSIXctPOSIXlt轻。

虽然data.frame中的列可能是一个列表,但拥有POSIXct会更好:

dat$TIMESTAMP <- as.POSIXct(strptime(dat$TIMESTAMP,"%Y-%m-%d %H:%M"))
#this works now as intended
melt(dat, id.vars=c("RECNUM", "TIMESTAMP"), variable.name="Measure")