如何用小鼠R仅估算一列或几列

时间:2019-08-22 16:00:28

标签: r dataframe imputation r-mice

我正在用R中的mouse包进行实验,并对如何将列排除在插补中感到好奇。

  1. 如果我只想对一栏进行均值插补, mice.impute.mean(y, ry, x = NULL, ...)函数似乎是我要使用的函数。我正在努力理解我需要包括什么才能使它起作用。
  2. 如果我的数据集包含名称,ID,出生日期等分类数据,这些数据不应该影响其他列的计算,并且在丢失时也不应该填写,我如何告诉小鼠排除这些数据计算中的列数?

我一直在使用小鼠数据集 nhanes供我探索。

谢谢

1 个答案:

答案 0 :(得分:4)

我不知道您的数据,因此无法为您创建示例,但是您正在准确地查找 mice()函数的此参数

  

predictorMatrix
  长度(块)行和ncol(数据)列的数字矩阵,其中包含0/1数据,该数据指定要用于每个目标列的一组预测变量。每行对应一个变量块,即一组要推算的变量。值为1意味着列变量用作目标块(行中)的预测变量。默认情况下,predictorMatrix是一个ncol(data)行和列的方阵,对角线除外,全为1。注意:对于两级插补模型(名称中带有“ 2l”的情况),也可以使用其他代码(例如2或-2)。

使用此参数,您可以定义要用于插补特定列的列。

  

位置
  具有与数据相同维度的逻辑的数据框或矩阵,指示应在数据中的何处创建插补。默认值,其中= = is.na(data),指定应估算缺少的数据。 where参数可用于过分估算观测到的数据,或跳过对所选缺失值的估算。

您可以在此处定义要为其创建插补的列。