我正在尝试创建数据的缺失图。 我运行了以下代码:
library(visdat)
library(naniar)
vis_miss(data, sort_miss = TRUE, show_perc = TRUE)
但是,标签是employment.factor
或变体而不是Employment
。如何更改此标签?
此外,我在数据集中的所有变量都包含在此处。如何选择缺失图中包含哪些特定变量?
答案 0 :(得分:0)
除了在绘制后更改变量名称之外,您还可以从实际数据集中将变量名称更改为一个新的子集吗? 使用dplyr软件包:
library(dplyr)
data_subset <- select(data, A, B, C)
vis_miss(data_subset)
sort_miss = TRUE根据所包含的x轴上的大多数缺失来排列变量 vis_miss返回一个ggplot对象,因此可以明显地更改标签。这个github项目似乎提供了一个使用vis_miss和R的空气质量数据集的示例:https://github.com/ropensci/visdat/blob/master/R/vis-miss.R
您可以获得缺少度最高的列的顺序:
na_sort <- order(colSums(is.na(data)), decreasing = TRUE)
然后获取这些列的名称:
col_order_index <- names(data)[na_sort]
将变量汇总在一起进行绘图(行号的列,然后是变量,然后是该变量的内容)
dat_pre_vis <- as.data.frame(data.na[row_order_index , ])
您是否尝试过查阅?naniar的帮助文档,该文档列出了软件包中包含的所有可用功能?这里有一些有关使用naniar的解释:https://cran.r-project.org/web/packages/naniar/vignettes/naniar-visualisation.html