我通常对Python很陌生,而且我在制作线性回归模型时遇到了麻烦。我需要从大型excel数据集(.csv)中的训练和测试集中创建它。
我已经拆分了数据集:
action.payload
如何使用此拆分数据使用平均平均误差制作线性回归模型?
感谢。
答案 0 :(得分:1)
Scikit-learn
很简单
chartValueSelected
加载数据集并将数据拆分为训练/测试集
import pandas as pd
from sklearn import linear_model
from sklearn.metrics import mean_absolute_error
将目标拆分为训练/测试集
X_train = df[split]
X_test = df[~split]
创建线性回归对象
y_train = df.target[split]
y_test = df.target[~split]
使用训练集训练模型
regr = linear_model.LinearRegression()
预测目标
regr.fit(X_train, y_train)
打印系数
y_pred = regr.predict(X_test)
打印平均绝对误差
print('Coefficients: \n', regr.coef_)