Question

我的数据集有200多个变量，其中大多数都有点表示缺失值：

年龄
19个
20个
。
56个
23

R会将点识别为Null值。所以当我使用

时

> library(Hmisc) # cut2
> split(data, cut2(data$Age, g=3))

将数据划分为3个波段，我收到错误消息：

if（cj == upper）next错误：缺少值需要TRUE / FALSE
另外：警告信息：
1：在cut2（data2 $ Household_Count，g = 10）：由强制引入的NA 2：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
3：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
4：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
5：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
6：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
7：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
8：在Ops.factor（x，（lower - min.dif.factor * min.dif））中：对因子没有意义
9：在Ops.factor（x，（lower - min.dif.factor * min.dif））：对因子无意义

我已确认此错误是由Null值引起的。但是，由于我在不同的行中有太多的点变量，我不能简单地通过过滤去掉点。如何摆脱点并对每个变量执行“拆分”命令？

Answer 1

在使用complete.cases之前，您可以使用cut删除NA或缺失值。见?complete.cases

示例：

y <- airquality[,  1]
yy<-y[complete.cases(y)]
yyy<-cut(yy,3)

删除数据集中的点并将数据拆分为相等的带

1 个答案: