拟合线性回归模型的数值误差

时间:2018-05-03 08:01:01

标签: python numpy machine-learning scikit-learn regression

我开始制定美元兑换INR的预测模型。 我将数据拆分,将日期转换为序数格式,并将其拟合为LinearRegression模型。

import pandas as pd
from sklearn import linear_model
import matplotlib.pyplot as plt
import datetime as dt
data = pd.read_csv("FED-RXI_N_M_IN.csv")
rates = {}
rates = {'date':[x for x in data.Date],
         'rate':[y for y in data.Value]}
df = pd.DataFrame(rates, columns = ["date", "rate"])
dates = df['date']
rates = df['rate']
dates = pd.to_datetime(dates)
dates = dates.map(dt.datetime.toordinal)

#train data
dates_test = dates[0:110]
rates_test = rates[0:110]

#test data
dates_train = dates[110:543]
rates_train = rates[110:543]

plt.plot_date(dates_test, rates_test, fmt="g-")
plt.title('US-INR Currency Predictor')
plt.ylabel("INR rate against $1")
plt.xlabel("Date")

#training
regr = linear_model.LinearRegression()
regr.fit(dates_train,rates_train)
rates_pred = regr.predict(dates_test)
plt.scatter(dates_test, rates_test,  color='black')
plt.title('Test Data')
plt.xlabel('Date')
plt.ylabel('Rate')
plt.plot(dates_test, rates_pred, color = 'red', linewidth= 3)
plt.xticks(())
plt.yticks(())
plt.show()
print( str((regr.predict(736753))) )

我在regr.fit(dates_train,rates_train)

收到此错误

enter image description here

请帮我解决一下。我是这个领域的初学者。

1 个答案:

答案 0 :(得分:0)

看起来 sklearn 需要(row number, column number)的数据形状。为此,您可以使用reshape方法。

此外,您需要将numpy数组作为输入传递给fit方法。

rates = df['rate'].values.reshape(len(df.index), 1)   

#train data
dates_test = dates[0:110, :]
rates_test = rates[0:110, :]

#test data
dates_train = dates[110:543, :]
rates_train = rates[110:543, :]