Question

我正在尝试学习如何用计算值替换一个变量中的缺失数据。

我的数据集（bk3）如下：

ign:  80, 96, 75, 66, 53

Mean: 26, 24, 27, 34, 41

sd:    6,  7, NA,  8,  4

lci:  24, 25, 20, 32, 38

uci:  29, 26, 29, 33, 43

dput：

bk3 <- structure(list(ign = c(80L, 96L, 75L, 66L, 53L), mean = c(26L, 24L, 
  27L, 34L, 41L), sd = c(6L, 7L, NA, 8L, 4L), lci = c(24L, 25L, 20L,
  32L, 38L), uci = c(29L, 26L, 29L, 33L, 43L)), .Names = c("ign",
  "mean", "sd", "lci", "uci"), class = "data.frame", row.names = c(NA, -5L))

基本上，我使用95％的置信区间（uci，lci）和样本n（ign）来计算丢失的SD（sd）。

我要使用的代码是：

bk3$sd[is.na(bk3$sd)] <- (bk3$uci - bk3$lci) * sqrt(bk3$ign)/3.92

但是我收到以下警告消息：

“要替换的项目数不是替换长度的倍数”

更新：我正在尝试创建一个函数，如果提供了适当的变量，该函数将自动执行此操作。我尝试将其设置为以下格式：

fillsd <- function(x, n, u, l)
{ 
i1 <- is.na(x)
i2 <- n > 59
x[i1 & i2] <- with(df, (u[i1 & i2] - l[i1 & i2]) * (sqrt(n[i1 & 
i2])/3.92)) }

虽然函数“ fillsd”似乎已在我的全局环境中正确保存，但是当我尝试将其与以下代码一起使用时，该函数不起作用：

fillsd(x="bk3$sd", n="bk3$ign", u="bk3$uci", l="bk3$lci")

该代码未产生错误消息，但该函数似乎也未执行任何操作。这是我研究的第一个功能，我无法找到可比较的示例来了解代码的哪一部分不正确。如果您对如何进行这项工作有任何想法，请告诉我。谢谢！

Answer 1

如果我们replace将'sd'的NA元素与其他列的计算值相对应的元素，则逻辑索引应位于赋值的两侧。根据计算的性质，它给出的长度等于数据集的行数，而lhs的长度更短，因为我们只对包含NA元素的行进行子集化，这会导致长度不等式，从而导致误差< / p>

i1 <- is.na(bk3$sd)
bk3$sd[i1] <- with(bk3, (uci[i1] - lci[i1]) * sqrt(ign[i1])/3.92)

但是，如果我们决定基于某些列的mean中的sum来获得摘要，则它是单个数字，并且在rhs上没有逻辑索引是有意义的随着价值的回收

数据

bk3 <- structure(list(ign = c(80, 96, 75, 66, 53), Mean = c(26, 24, 
27, 34, 41), sd = c(6, 7, NA, 8, 4), lci = c(24, 25, 20, 32, 
38), uci = c(29, 26, 29, 33, 43)), .Names = c("ign", "Mean", 
"sd", "lci", "uci"), row.names = c(NA, -5L), class = "data.frame")

用计算值替换缺失值

1 个答案:

数据