我正在使用脱字符号包中的nearZeroVar()函数来查找方差接近零的列。它从数据集中检测出10列。
predictorInfo = nearZeroVar(new_train,saveMetrics = TRUE)
new_train = new_train[,!predictorInfo$nzv]
dim(new_train)
然后我在preProcess()函数中尝试对同一数据集使用'nzv'参数,但它只能检测到数据集中的六列。
a<-preProcess(new_train, c('nzv'))
new_train=predict(a, newdata=new_train)
dim(new_train)
我的问题是为什么它为同一数据集显示不同的输出? nearZeroVar()函数与preProcess()函数中的'nzv'参数之间是否有区别?