如何使用python sklearn线性回归预测数据

时间:2020-04-05 02:49:38

标签: python pandas scikit-learn

Sales.xlsx我在excel文件中有1月到6月的销售数字,我想使用sklearn线性回归预测7月的数字。

我到这为止。

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression

df = pd.read_excel('Sales.xlsx')

x = [ ]
y = [ ]


model = LinearRegression()
model.fit(x, y)

x_predict = []
y_predict = model.predict(x_predict)
print(y_predict)

1 个答案:

答案 0 :(得分:0)

因此,x将是您希望进行预测时要使用的列的一部分,而y是具有已知值(此处为sales)的列。

因此,例如,假设您尝试根据需求和GDP预测销售量,则x和y如下:

x = df.loc[:, ['demand', 'GDP']]
y = df.loc[:, 'sales']

x_predict行应省略。您永远不会尝试预测x,它们是作为预测基础的特征或值。

另一个问题是您没有将数据集分为训练和测试,因此没有剩余值可根据模型进行预测。

相关问题