应用错误收集

如何删除NA条件{dplyr package}或{base}的data.frame列

时间：2016-02-18 07:46:51

标签： r dataframe dplyr na

我的问题：一个包含很少值的列的大型数据集。

我问道：使用 dplyr 包（或基础）删除包含缺失值频率的data.frame列。

我尝试了什么：

 # my data.frame
 data <- data.frame(column1 = c(1, 2, 13, 4),
                    column2 = c(4, NA, 9, 1),
                    column3 = c(12, NA, NA, 78)) 

  # relative frequency of NA values
  missing_values <- colMeans(is.na(data))

  # selecting columns
  library(dplyr)

  complete_table <- data %>%
                   select (missing_values>0.25)

0 个答案:

没有答案