我几乎不了解r或任何类型的编码。我正在上一堂课,需要使用r分析数据。我的最后一个项目是从智能手表下载和划分加速度计数据。我已经成功地做到了。然后,我必须运行四个模型,例如决策树,随机森林,多项式逻辑回归和SMV。我只有决策树可以工作。
文件太大,需要进行350万次观察,因此我不得不选择一小部分数据才能使其运行而不会超时。我的数据是train1。变量“ gt”可以是步行,坐着,站立,上楼梯,下楼梯,空和自行车。我把它作为一个因子并将其称为“ gtF”,我真的只想将其与变量“ x”,“ y”和“ z”进行比较,但它不会那样运行,所以我只是尝试下面的内容删除“索引”,“模型”和“设备”。错误在代码下方。
谁能提供关于我做错事情的建议?请解释一下,就像您在向孩子讲解一样,因为我是一个非常基本的初学者。
我还包括了SVM和多项式Logistic回归的代码和错误。
我的教练说,某些错误消息表明缺少数据。我跑了老鼠,收到一条消息说所有数据都在那里。
随机森林
library(randomForest)
rf <- randomForest(gtF~ .-Index - Model -Device -gt,data=train1,
ntree = 300,
mtry = 8,
importance = TRUE,
proximity = TRUE)
print(rf)
attributes(rf)
支持向量机
library(e1071)
mymodel <- svm(gtF~ .-Index -Model -Device -gt, data = train1)
summary(mymodel)
plot(mymodel, data = train1,
gt~x)
contrasts<-
(*tmp*
中的错误,值= contr.funs [1 + isOF [nn]]):对比只能应用于具有2个或更多水平的因子多项式Logistic回归
library(nnet)
mymodel <- multinom(out~.-Index -Model -Device -gt -gtF,data=train1)
summary(mymodel)
contrasts<-
(*tmp*
中的错误,值= contr.funs [1 + isOF [nn]]):对比只能应用于具有2个或更多水平的因子谢谢!
答案 0 :(得分:0)
对于第一个错误:
您的训练集中必须具有“ char”类的某些功能。
请检查以下内容:
> a <- c("1", "2",letters[1:5], "3")
> as.numeric(a)
[1] 1 2 NA NA NA NA NA 3
Warning message:
NAs introduced by coercion
第二个和第三个错误:
看看以下链接: