我必须拆分数据集。所以我使用这段代码。
if [info exists debug] {
puts "debugging mode: on"
else {
set debug 0
}
并且,我将删除数据集中级别超过32的因子变量。所以我使用了subset()函数。
a<-read.csv("philiphine.csv",header=TRUE)
factor_level<-a[, sapply(a, nlevels) > 32]
factor_names<-names(factor_level)
在?? ,我必须使用变量的位置。是否可以使用变量的名称?那么,如何使用变量的名称删除变量? 或者我应该只使用变量在subset()函数上的位置?
答案 0 :(得分:0)
您也可以使用以下命令
来实现相同目的a[, sapply(a, function(col) length(unique(col))) <= 32]