Question

Sales.xlsx我在excel文件中有1月到6月的销售数字，我想使用sklearn线性回归预测7月的数字。

我到这为止。

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression

df = pd.read_excel('Sales.xlsx')

x = [ ]
y = [ ]


model = LinearRegression()
model.fit(x, y)

x_predict = []
y_predict = model.predict(x_predict)
print(y_predict)

Answer 1

因此，x将是您希望进行预测时要使用的列的一部分，而y是具有已知值（此处为sales）的列。

因此，例如，假设您尝试根据需求和GDP预测销售量，则x和y如下：

x = df.loc[:, ['demand', 'GDP']]
y = df.loc[:, 'sales']

x_predict行应省略。您永远不会尝试预测x，它们是作为预测基础的特征或值。

另一个问题是您没有将数据集分为训练和测试，因此没有剩余值可根据模型进行预测。

如何使用python sklearn线性回归预测数据

1 个答案: