无法获得测试数据集的R平方

时间:2018-07-09 15:42:52

标签: r machine-learning regression linear-regression

我试图学习一些有关不同类型的回归的知识,并且通过下面的代码示例来破解自己的方式。

library(magrittr)
library(dplyr)


# Polynomial degree 1
df=read.csv("C:\\path_here\\auto_mpg.csv",stringsAsFactors = FALSE) # Data from UCI
df1 <- as.data.frame(sapply(df,as.numeric))

# Select key columns
df2 <- df1 %>% select(cylinder,displacement,horsepower,weight,acceleration,year,mpg)
df3 <- df2[complete.cases(df2),]


smp_size <- floor(0.75 * nrow(df3))
# Split as train and test sets
train_ind <- sample(seq_len(nrow(df3)), size = smp_size)

train <- mtcars[train_ind, ]
test <- mtcars[-train_ind, ]


Rsquared <- function (x, y) cor(x, y) ^ 2


# Fit a model of degree 1
fit <- lm(mpg~. ,data=train)
rsquared1 <-Rsquared(fit,test$mpg)
sprintf("R-squared for Polynomial regression of degree 1 (auto_mpg.csv)  is : %f", rsquared1)

我收到此错误:

'Error in cor(x, y) : 'x' must be numeric'

我从这里获得了代码示例(1.2b和1.3a)。

https://gigadom.wordpress.com/2017/10/06/practical-machine-learning-with-r-and-python-part-1/

原始数据在这里。

https://raw.githubusercontent.com/tvganesh/MachineLearning-RandPython/master/auto_mpg.csv

1 个答案:

答案 0 :(得分:2)

就在几分钟前,我为Function to calculate R2 (R-squared) in R投票。现在我想是你的,谢谢。

Rsquare函数需要两个向量,但是您已经传递了一个模型对象fit(这是一个列表)和一个向量test$mpg。我想您想在这里将predict(fit, newdata = test)作为它的第一个参数。