我有一个train_data,其中包含有关商店及其销售的信息。看起来像这样
我想建立一个多特征线性回归来预测销售'在test_data上,使用' DayofWeek'客户'促销'。
如何为此构建多元线性回归模型,最好使用SKlearn。
编辑:这里是我正在使用的数据集的链接,如果有人有兴趣:https://www.kaggle.com/c/rossmann-store-sales
这是我到目前为止所尝试过的。
import pandas as pd
from sklearn import linear_model
x=train_data[['Promo','Customers','DayOfWeek']]
y=train_data['Sales']
lm=LinearRegression()
lm.fit(x,y)
我收到的错误是' LinearRegression未定义'。
答案 0 :(得分:1)
您实际上并未导入LinearRegression
课程。如果你想导入linear_model
模块中的所有内容(通常不赞成),你可以这样做:
from sklearn.linear_model import *
lr = LinearRegression()
...
更好的做法是导入模块本身并为其指定别名。像这样:
import sklearn.linear_model as lm
lr = lm.LinearRegression()
...
最后你可以只导入你想要的课程:
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
...
答案 1 :(得分:0)
您已导入linear_model,它是包含的模块 LinearRegression()类。要调用LinearRegression类,请使用:
lm = linear_model.LinearRegression()
lm.fit(x,y)