我的数据集有200多个变量,其中大多数都有点表示缺失值:
年龄
19个
20个
。
56个
23
R会将点识别为Null值。所以当我使用
时> library(Hmisc) # cut2
> split(data, cut2(data$Age, g=3))
将数据划分为3个波段,我收到错误消息:
if(cj == upper)next错误:缺少值需要TRUE / FALSE
另外:警告信息:
1:在cut2(data2 $ Household_Count,g = 10):由强制引入的NA
2:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
3:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
4:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
5:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
6:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
7:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
8:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
9:在Ops.factor(x,(lower - min.dif.factor * min.dif)):对因子无意义
我已确认此错误是由Null值引起的。但是,由于我在不同的行中有太多的点变量,我不能简单地通过过滤去掉点。如何摆脱点并对每个变量执行“拆分”命令?
答案 0 :(得分:0)
在使用complete.cases
之前,您可以使用cut
删除NA或缺失值。见?complete.cases
示例:
y <- airquality[, 1]
yy<-y[complete.cases(y)]
yyy<-cut(yy,3)