Question

我必须拆分数据集。所以我使用这段代码。

if [info exists debug] {
    puts "debugging mode: on"
else {
    set debug 0
}

并且，我将删除数据集中级别超过32的因子变量。所以我使用了subset（）函数。

a<-read.csv("philiphine.csv",header=TRUE)
factor_level<-a[, sapply(a, nlevels) > 32]
factor_names<-names(factor_level)

在?? ，我必须使用变量的位置。是否可以使用变量的名称？那么，如何使用变量的名称删除变量？或者我应该只使用变量在subset（）函数上的位置？

Answer 1

您也可以使用以下命令

来实现相同目的

a[, sapply(a, function(col) length(unique(col))) <= 32]