R:用两个最近的变量合并data.table

时间:2015-03-24 10:17:45

标签: r merge data.table

编辑:代码工作得很好,是我的问题......

我想将多个data.tables合并为一个。每个表格中有三个columns,两个坐标xy和分配给坐标的值。但是,data.tables的坐标略有不同,所以我想合并最近的坐标,所以我得到了

x y Value_1 Value_2 ... Value_i

我发现这个thread 似乎解决了这个问题。提供了这个解决方案:

#Directly taken from the above mentioned thread:
func = function(u,v){
vec = with(DT2, (u-x)^2 + (v-y)^2)
DT2[which.min(vec),]$Q
}

transform(DT1, Q=apply(DT1, 1, function(u) func(u[1], u[2])))

似乎解决了这个问题。

但是,如果我使用以下数据:

#create data
library(data.table)
dt1 = data.table(X = runif(10000), Y = runif(10000), Value = runif(10000, min=5, max=10))
dt2 = data.table(X = runif(10000), Y = runif(10000), Value = runif(10000, min=5, max=10))

#Round data
dt1 = round(dt1, 3)
dt2 = round(dt2, 3)

setkey(dt1, "X","Y")

#Function from solution
func = function(u,v){
vec = with(dt2, (u-X)^2 + (v-Y)^2)
dt2[which.min(vec),]$Value_1
}

test = transform(dt1, Value=apply(dt1, 1, function(u) func(u[1], u[2])))

我收到以下错误消息:

Error in data.table(list(X = c(0, 0.001, 0.001, 0.001, 0.001, 0.001, 0.001,: 
  column or argument 2 is NULL

当我使用我的"真实"时,也会出现此错误消息。数据与上面创建的数据非常相似。

我相当新,并且已经阅读了很多关于data.table的内容,但还没找到一种有效的方法。有什么建议?

1 个答案:

答案 0 :(得分:0)

df2中没有Q列,这使得

的结果为空
  dt2[which.min(vec),]$Q

func定义中。