从拆分.csv数据集制作线性回归模型的最佳方法是什么?

时间:2017-04-30 16:13:11

标签: python csv numpy split linear-regression

我通常对Python很陌生,而且我在制作线性回归模型时遇到了麻烦。我需要从大型excel数据集(.csv)中的训练和测试集中创建它。

我已经拆分了数据集:

action.payload

如何使用此拆分数据使用平均平均误差制作线性回归模型?

感谢。

1 个答案:

答案 0 :(得分:1)

Scikit-learn很简单

chartValueSelected

加载数据集并将数据拆分为训练/测试集

import pandas as pd
from sklearn import linear_model
from sklearn.metrics import mean_absolute_error

将目标拆分为训练/测试集

X_train = df[split]
X_test  = df[~split]

创建线性回归对象

y_train = df.target[split]
y_test = df.target[~split]

使用训练集训练模型

regr = linear_model.LinearRegression()

预测目标

regr.fit(X_train, y_train)

打印系数

y_pred = regr.predict(X_test)

打印平均绝对误差

print('Coefficients: \n', regr.coef_)