我在R中按日期和时间合并了两个数据帧(按日期时间)。一个数据帧是一个简单的序列,另一个是6242 obs的数据,但我需要每小时一次的数据(即使它是零)
当我合并时,我的结果重复了匹配的行,而不是插入它们。我是否可以使用合并函数来保留所有行,但不是那些没有信息的重复日期的行?我想要1933行而不是1934年。
x <- data.frame (DateTime = seq(as.POSIXct("1986-01-01"),
as.POSIXct("2012-04-27"),
by=(3600)))
y <- read.csv("TS1.csv", header = FALSE, as.is = TRUE)
names(y) <- c("Date", "Time", "Rainfall")
y$Station<- rep("D1253",length(6242))
#reformat so date is the same
y$Date <- as.Date(y$Date, format = "%m/%d/%Y")
y$DateTime <- paste(y$Date, y$Time, sep=" ")
>head(y)
Date Time Rainfall Station DateTime
1 1986-01-01 21:00 0.01 D1253 1986-01-01 21:00
2 1986-01-02 9:00 0.01 D1253 1986-01-02 9:00
3 1986-01-02 10:00 0.01 D1253 1986-01-02 10:00
4 1986-01-02 11:00 0.01 D1253 1986-01-02 11:00
5 1986-01-02 12:00 0.01 D1253 1986-01-02 12:00
6 1986-01-02 13:00 0.01 D1253 1986-01-02 13:00
#Combine datasets
z<- merge(x, y, by='DateTime', all=TRUE) #the all.x=TRUE gives me all NAs
z$Rainfall[is.na(z$Rainfall)] <- 0.00
> head(z)
DateTime Date Time Rainfall Station
1933 1986-03-14 18:00:00 1986-03-14 18:00 0.01 D1253
1934 1986-03-14 19:00:00 <NA> <NA> 0.00 <NA>
1935 1986-03-14 19:00:00 1986-03-14 19:00 0.01 D1253
1936 1986-03-14 20:00:00 <NA> <NA> 0.00 <NA>
1937 1986-03-14 20:00:00 1986-03-14 20:00 0.01 D1253
1938 1986-03-14 21:00:00 <NA> <NA> 0.00 <NA>
1939 1986-03-14 21:00:00 1986-03-14 21:00 0.09 D1253
1940 1986-03-14 22:00:00 <NA> <NA> 0.00 <NA>
1941 1986-03-14 22:00:00 1986-03-14 22:00 0.02 D1253
1942 1986-03-14 23:00:00 <NA> <NA> 0.00 <NA>
答案 0 :(得分:2)
all.x = TRUE 是解决此问题的正确方法:
z <- merge(x, y, by='DateTime', all.x = TRUE)
z[is.na(z)] <- 0 # Fill in the NA's with 0 for the hours with no data
答案 1 :(得分:0)
使用as.POSIXct
完成后,使用all.x=TRUE