我只是在extracat包中使用了visna()函数来可视化丢失的数据,但是我不知道蓝色单元格是什么意思?以及如何解释右侧的条形图?
df <- data.frame(replicate(25,sample(0:1,1000,rep=TRUE)))
df2 <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))
# visualise the number of missings in cases using visna from extracat
extracat::visna(df2)
答案 0 :(得分:0)
蓝色单元格代表缺失值。
对于您的数据框,这意味着: 变量x1在data.frame的末尾具有所有缺少的值。 对于变量X25,缺失值分布在整个数据帧中
下面的红色条是此变量缺少的值的数量。 我认为右边的bar char是相应数据箱中完整行的数量。
为获得更好的缺失数据可视化效果,请同时查看naniar软件包。 (https://cran.r-project.org/web/packages/naniar/vignettes/getting-started-w-naniar.html)