R中插入符号包中preProcess()中的nearZeroVar()和'nzv'参数有什么区别?

时间:2019-03-12 19:29:48

标签: r r-caret data-cleaning caret

我正在使用脱字符号包中的nearZeroVar()函数来查找方差接近零的列。它从数据集中检测出10列。

predictorInfo = nearZeroVar(new_train,saveMetrics = TRUE)
new_train = new_train[,!predictorInfo$nzv]
dim(new_train)

然后我在preProcess()函数中尝试对同一数据集使用'nzv'参数,但它只能检测到数据集中的六列。

a<-preProcess(new_train, c('nzv'))
new_train=predict(a, newdata=new_train)
dim(new_train)

我的问题是为什么它为同一数据集显示不同的输出? nearZeroVar()函数与preProcess()函数中的'nzv'参数之间是否有区别?

0 个答案:

没有答案