实现多特征线性回归

时间:2017-10-02 18:17:31

标签: python pandas scikit-learn

我有一个train_data,其中包含有关商店及其销售的信息。看起来像这样 enter image description here

我想建立一个多特征线性回归来预测销售'在test_data上,使用' DayofWeek'客户'促销'。

如何为此构建多元线性回归模型,最好使用SKlearn。

编辑:这里是我正在使用的数据集的链接,如果有人有兴趣:https://www.kaggle.com/c/rossmann-store-sales

这是我到目前为止所尝试过的。

import pandas as pd

from sklearn import linear_model

x=train_data[['Promo','Customers','DayOfWeek']]

y=train_data['Sales']

lm=LinearRegression()


lm.fit(x,y)

我收到的错误是' LinearRegression未定义'。

2 个答案:

答案 0 :(得分:1)

您实际上并未导入LinearRegression课程。如果你想导入linear_model模块中的所有内容(通常不赞成),你可以这样做:

from sklearn.linear_model import *
lr = LinearRegression()
...

更好的做法是导入模块本身并为其指定别名。像这样:

import sklearn.linear_model as lm
lr = lm.LinearRegression()
...

最后你可以只导入你想要的课程:

from sklearn.linear_model import LinearRegression
lr = LinearRegression()
...

答案 1 :(得分:0)

您已导入linear_model,它是包含的模块 LinearRegression()类。要调用LinearRegression类,请使用:

lm = linear_model.LinearRegression()
lm.fit(x,y)