我有两个看似相同的动物园对象,它们是由csv文件中不同时间段的相同命令创建的。我尝试将它们组合成一个长动物园,但我失败了“索引重叠”错误。 ('merge''c'或'rbind'都会产生相同错误文本的变体。)据我所知,没有重复项,时间段也不重叠。我究竟做错了什么?我在Windows 7 64bit上使用R版本3.0.1,如果这有所不同。
> colnames(z2)
[1] "Amb" "HWS" "Diff"
> colnames(t.tmp)
[1] "Amb" "HWS" "Diff"
> max(index(z2))
[1] "2012-12-06 02:17:45 GMT"
> min(index(t.tmp))
[1] "2012-12-06 03:43:45 GMT"
> anyDuplicated(c(index(z2),index(t.tmp)))
[1] 0
> c(z2,t.tmp)
Error in rbind.zoo(...) : indexes overlap
>
更新:在尝试制作可重现的案例时,我得出结论,这是一个实现错误,因为我正在处理大量的行:如果最终结果超过311434行,则失败。
> nrow(c(z2,head(t.tmp,n=101958)))
Error in rbind.zoo(...) : indexes overlap
> nrow(c(z2,head(t.tmp,n=101957)))
[1] 311434
# but row 101958 inserts fine on its own so its not a data problem.
> nrow(c(z2,tail(head(t.tmp,n=101958),n=2)))
[1] 209479
我很抱歉,但是我没有R脚本技能来制作一个关键长度的动物园,希望有人可以帮我解决..
更新2-回应Jason的建议..:问题出在MATCH中,但我的R技能不足以知道如何解释它 - 它是否意味着MATCH在x.t中找到重复值而anyDuplicated不是?
> x.t <- c(index(z2),index(t.tmp));
> length(x.t)
[1] 520713
> ix <- ORDER (x.t)
> length(ix)
[1] 520713
> x.t <- x.t[ix]
> length(ix)
[1] 520713
> length(x.t)
[1] 520713
> tx <- table(MATCH(x.t,x.t))
> max(tx)
[1] 2
> tx[which(tx==2)]
311371 311373 311378 311383 311384 311386 311389 311392 311400 311401
2 2 2 2 2 2 2 2 2 2
> anyDuplicated(x.t)
[1] 0
答案 0 :(得分:0)
经过所有的测试和头部刮擦后,似乎我遇到的问题与时区有关。将环境设置为与原始数据相同的时区使其工作正常。
Sys.setenv(TZ="GMT")
> z3<-rbind(z2,t.tmp)
> nrow(z3)
[1] 520713
感谢how to guard against accidental time zone conversion鼓励人们朝这个方向发展。