我训练了一个svm模型。我想测试它,但我在predict()函数中遇到错误。为简单起见,我在这里将测试和训练数据拆分为非随机70/30分割。
library(e1071)
train <- mydata[1:9731, ]
test <- mydata[(9731+1):13901, ]
mysvm <- svm(formula = outcome ~ BW + GA, data = train, type = "C-classification", kernel = "linear", gamma = 1, cost = 2)
predict(mysvm, newdata=test)
错误消息来自predict():
Error in names(ret2) <- rowns :
'names' attribute [4170] must be the same length as the vector [4106]
数据的头部看起来像......
> head(mydata)
BW outcome GA
1 2.00 Survived 34
2 2.81 Survived 41
3 1.85 Survived 35
4 2.23 Survived 32
5 1.21 Survived 34
6 2.91 Survived 37
This user有相同的错误消息。问题是他/她没有使用数据帧。这不是我的问题。
> class(test)
[1] "data.frame"
> class(train)
[1] "data.frame"
我不确定这个错误发生的原因或意义。追溯()和调试(预测)也没有帮助。
答案 0 :(得分:6)
由于您尚未提供数据,因此很难提供解决方案。但是,我猜您的测试数据中包含NA
或GA
的64行BW
值。如果删除包含任何NA的行,我认为您的预测将会运行:
predict(mysvm, newdata = test[!rowSums(is.na(test)), ])
这当然意味着您不会对这些行进行任何预测。您如何处理由您决定(例如,您可以归咎于缺失的值或适合您的特定用例的任何内容)。
答案 1 :(得分:-1)
我用:
模型&lt; - svm(y = 标签,x = 数据,...)
pred&lt; - predict(model, data )
一切都很好。