r - 缺失值分析 - VIM - 没有足够的垂直空间来显示频率

时间:2017-07-21 19:33:07

标签: r missing-data

我正在尝试可视化丢失的数据模式。我正在使用VIM包中的aggr()函数并继续收到此警告消息:

  

在plot.aggr(res,...)中:没有足够的垂直空间来显示   频率(太多组合)

问题是由于我试图显示太多数据而无法弄清楚如何调整绘图大小以允许额外数据。我有20个变量,我正在尝试可视化,但它不适合。


我发现this问题,但解决方案不起作用。

我创建了一个演示此问题的示例:

df <- data.frame(replicate(25,sample(0:1,1000,rep=TRUE)))

df2 <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), 
          prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))

aggr(df2, plot = TRUE, combined=TRUE, sortVars=FALSE, sortCombs=TRUE,
    numbers=TRUE, prop=c(FALSE, FALSE), only.miss=FALSE, cex.numbers=.6,
    cex.axis=.6)

1 个答案:

答案 0 :(得分:1)

我意识到这不能解决如何在VIM中执行此操作,但是这里有一些其他方法可以使用

来显示缺失的数据


df <- data.frame(replicate(25,sample(0:1,1000,rep=TRUE)))

df2 <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), 
                                                        prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))


# visualise using visdat
visdat::vis_miss(df2)

# apply clustering
visdat::vis_miss(df2, cluster = TRUE)

# sort the rows
visdat::vis_miss(df2, sort_miss = TRUE)

# visualise the number of missings in cases using visna from extracat
extracat::visna(df2)

# sort by rows
extracat::visna(df2, sort = "r")

# sort by columns
extracat::visna(df2, sort = "c")

# visualise the number of missings in each variable using naniar `gg_miss_var`
naniar::gg_miss_var(df2)