R的随机森林,SVM和多项式Lo​​gistic回归

时间:2019-12-06 01:57:43

标签: r

我几乎不了解r或任何类型的编码。我正在上一堂课,需要使用r分析数据。我的最后一个项目是从智能手表下载和划分加速度计数据。我已经成功地做到了。然后,我必须运行四个模型,例如决策树,随机森林,多项式逻辑回归和SMV。我只有决策树可以工作。

文件太大,需要进行350万次观察,因此我不得不选择一小部分数据才能使其运行而不会超时。我的数据是train1。变量“ gt”可以是步行,坐着,站立,上楼梯,下楼梯,空和自行车。我把它作为一个因子并将其称为“ gtF”,我真的只想将其与变量“ x”,“ y”和“ z”进行比较,但它不会那样运行,所以我只是尝试下面的内容删除“索引”,“模型”和“设备”。错误在代码下方。

谁能提供关于我做错事情的建议?请解释一下,就像您在向孩子讲解一样,因为我是一个非常基本的初学者。

我还包括了SVM和多项式Lo​​gistic回归的代码和错误。

我的教练说,某些错误消息表明缺少数据。我跑了老鼠,收到一条消息说所有数据都在那里。

随机森林

library(randomForest)
rf <- randomForest(gtF~ .-Index - Model -Device -gt,data=train1,
                   ntree = 300,
                   mtry = 8,
                   importance = TRUE,
                   proximity = TRUE)
print(rf)
attributes(rf)

randomForest.default(m,y,...)中的错误:外部函数调用(arg 1)中的NA / NaN / Inf

支持向量机

library(e1071)
mymodel <- svm(gtF~ .-Index -Model -Device -gt, data = train1)
summary(mymodel)
plot(mymodel, data = train1,
     gt~x)

contrasts<-*tmp*中的错误,值= contr.funs [1 + isOF [nn]]):对比只能应用于具有2个或更多水平的因子

多项式Lo​​gistic回归

library(nnet)
mymodel <- multinom(out~.-Index -Model -Device -gt -gtF,data=train1)
summary(mymodel)

contrasts<-*tmp*中的错误,值= contr.funs [1 + isOF [nn]]):对比只能应用于具有2个或更多水平的因子

谢谢!

1 个答案:

答案 0 :(得分:0)

对于第一个错误:

您的训练集中必须具有“ char”类的某些功能。

请检查以下内容:

> a <- c("1", "2",letters[1:5], "3")
> as.numeric(a)
[1]  1  2 NA NA NA NA NA  3
Warning message:
NAs introduced by coercion 

第二个和第三个错误:

看看以下链接:

Error in contrasts when defining a linear model in R