我有两个包含时间序列数据的CsV文件。我想将两者合并为一个文件。 File1每隔1分钟有一次定期数据。 File2具有非周期性的事件触发数据。 File2中数据的时间戳可能与File1中的数据一致,也可能不一致。我想合并两个数据集以创建一个数据集,其时间戳是Data1和Data2的并集。对于两者都不常见的时间戳,我希望相应数据集的缺失条目表示为NA。
以下是File1的示例输入:
Time A1 A2
2013-08-05 00:00:00 2 1
2013-08-05 00:01:00 2 1
2013-08-05 00:02:00 1 1
以下是File2的示例输入:
Time B1 B2 B3
2013-08-01 12:10:21 5 1 1
2013-08-05 00:02:00 5 1 1
2013-08-05 12:13:44 14 1 2
预期输出如下:
Time A1 A2 B1 B2 B3
2013-08-01 12:10:21 NA NA 5 1 1
2013-08-05 00:00:00 2 1 NA NA NA
2013-08-05 00:01:00 2 1 NA NA NA
2013-08-05 00:02:00 1 1 5 1 1
2013-08-05 12:13:44 NA NA 14 1 2
我使用了merge.zoo,并按照本论坛其他相关帖子的建议尝试了merge.xts。但我没有得到预期的输出。这是我使用的代码。
A <- read.zoo(read.csv("File1.csv", header=TRUE));
B <- read.zoo(read.csv("File2.csv", header=TRUE));
C <- merge.zoo(A,B);
感谢您提供的任何帮助。谢谢。
答案 0 :(得分:2)
应该替换文件中读取的行,如下所示:
> A <- read.zoo("File1.csv", header = TRUE, tz = "", sep = ",")
> B <- read.zoo("File2.csv", header = TRUE, tz = "", sep = ",")
> merge(A, B)
A1 A2 B1 B2 B3
2013-08-01 12:10:21 NA NA 5 1 1
2013-08-05 00:00:00 2 1 NA NA NA
2013-08-05 00:01:00 2 1 NA NA NA
2013-08-05 00:02:00 1 1 5 1 1
2013-08-05 12:13:44 NA NA 14 1 2
这是可重复的形式:
Lines1 <- " Time, A1, A2
2013-08-05 00:00:00, 2, 1
2013-08-05 00:01:00, 2, 1
2013-08-05 00:02:00, 1, 1
"
Lines2 <- " Time, B1, B2, B3
2013-08-01 12:10:21, 5, 1, 1
2013-08-05 00:02:00, 5, 1, 1
2013-08-05 12:13:44, 14, 1, 2
"
library(zoo)
A <- read.zoo(text = Lines1, header = TRUE, tz = "", sep = ",")
B <- read.zoo(text = Lines2, header = TRUE, tz = "", sep = ",")
merge(A, B)