尝试在具有400个样本的数据集上运行Random Forest,并在数据框df中运行大约360个变量:
我正在尝试使用变量(s10
,s100
等)来预测基因型。这是我正在使用的代码:
rf <-randomForest(Genotype ~ ., data = df, importance = TRUE, proximity = TRUE)
但我不断收到错误消息:
Error in if (n == 0) stop("data (x) has 0 rows") :
argument is of length zero
我做错了什么?
答案 0 :(得分:0)
首先,不要将您的对象命名为R函数(即,#34; df&#34;)。其次,尝试randomForest的非公式接口。让我们来看你。
( rf <-randomForest(y=my.df[,"Genotype"], x=my.df[,2:ncol(my.df)], importance = TRUE, proximity = TRUE) )