删除数据集中的点并将数据拆分为相等的带

时间:2013-08-21 22:21:57

标签: r package

我的数据集有200多个变量,其中大多数都有点表示缺失值:

年龄
19个
20个

56个
23

R会将点识别为Null值。所以当我使用

> library(Hmisc) # cut2
> split(data, cut2(data$Age, g=3))

将数据划分为3个波段,我收到错误消息:

if(cj == upper)next错误:缺少值需要TRUE / FALSE
另外:警告信息:
1:在cut2(data2 $ Household_Count,g = 10):由强制引入的NA 2:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
3:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
4:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
5:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
6:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
7:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
8:在Ops.factor(x,(lower - min.dif.factor * min.dif))中:对因子没有意义
9:在Ops.factor(x,(lower - min.dif.factor * min.dif)):对因子无意义

我已确认此错误是由Null值引起的。但是,由于我在不同的行中有太多的点变量,我不能简单地通过过滤去掉点。如何摆脱点并对每个变量执行“拆分”命令?

1 个答案:

答案 0 :(得分:0)

在使用complete.cases之前,您可以使用cut删除NA或缺失值。见?complete.cases

示例:

y <- airquality[,  1]
yy<-y[complete.cases(y)]
yyy<-cut(yy,3)