如何检查数据表中每一行的列值是否在另两个范围内

时间:2019-03-29 20:32:27

标签: r data.table intervals

我现在正在研究R问题,在最后一步,我想检查我的95%置信区间是否包含参数的真实值。我在此步骤中有一个问题。

dat <- data.table(low = c(0.9, 1.1, 1, 0.95),
                  up = c(0.99, 1.2, 1.3, 1.4),
                  true = c(1, 1.15, 1.2, 1.5))

例如,在第一行中,我想检查真实值1是否具有0.9到0.99的置信区间。显然不是这样返回0。理想的结果将是:

result <- data.table(low = c(0.9, 1.1, 1, 0.95),
                     up = c(0.99, 1.2, 1.3, 1.4),
                     true = c(1, 1.15, 1.2, 1.5), 
                     conv = c(0, 1, 1, 0))
print(result)

有什么有效的方法可以解决这个问题?非常感谢您的帮助。

2 个答案:

答案 0 :(得分:4)

最有效的方法可能是between运算符:

> result[, conv2 := as.integer(true %between% .(low, up))]
> result
    low   up true conv conv2
1: 0.90 0.99 1.00    0     0
2: 1.10 1.20 1.15    1     1
3: 1.00 1.30 1.20    1     1
4: 0.95 1.40 1.50    0     0

您可以跳过as.integer来获取逻辑列,这在R中对此类数据进行编码时更为标准。

我在这里使用的between函数来自data.table,具有两种语法:

x %between% list(dn, up)
between(x, dn, up)

DT[...]内,您可以将list()缩短为.()

答案 1 :(得分:0)

这在data.table中是惯用的

dat[, inConf := ifelse(true >= low & true <= up,T,F)]

###alternatively with 0,1
dat[, inConf := ifelse(true >= low & true <= up,1,0)]