标签: r apache-spark parquet missing-data sparklyr
我在hadoop中有.parquet的数据。我想归咎于缺失的价值。我在代码中尝试了数据:
mydata %>% mutate_if(is.numeric, funs(replace(.,is.na(.), mean(., na.rm = TRUE)))) %>% mutate_if(is.factor, funs(replace(.,is.na(.), Mode(na.omit(.)))))
但是,代码是错误的。