我可以在python控制台中运行R脚本,就像本机一样。
下面我给出了线性回归的简单例子。在执行回归之前,首先使用Boruta
库执行特征选择,然后在测试和训练中分割样本,然后使用lm
函数执行回归。
我应该做什么tp复制这个脚本并粘贴在python控制台中,然后运行它并获得结果。如何正确地将此代码插入到python中?没有rpy
可以吗?
mydat=read.csv("C:/Users/Admin/Downloads/test.csv", sep=";",dec=",")
View(mydat)
str(mydat)
mydat$symboling.<-NULL
mydat$make.<-NULL
mydat$num.of.cylinders.<-NULL
mydat$fuel.type.<-NULL
mydat$aspiration.<-NULL
mydat$num.of.cylinders.<-NULL
#Feature Selection
library("Boruta")
FS=Boruta(normalized.losses.~.,data=mydat)
getSelectedAttributes(FS, withTentative = F)
plot(FS, cex.axis=0.5)
#get scatterplot
scatter.smooth(x=mydat$length.,y=mydat$normalized.losses.,main="normalized losse~length")
#split sample on train and sample
index <- sample(1:nrow(mydat),round(0.70*nrow(mydat)))
train <- mydat[index,]
test <- mydat[-index,]
#build the model
mymodel=lm(normalized.losses.~.,data=train)
summary(mymodel)
AIC(mymodel)
#check accuracy for train
pred.tr=predict(mymodel,train)
actual_pred.tr=data.frame(cbind(actual=train$normalized.losses.,predicteds=pred.tr))
actual_pred.tr