我正在尝试使用三个独立变量拟合线性回归模型,并使用sklearn计算均方误差,但我似乎无法做到正确。
我的数据是波士顿住房,三个独立变量如下: 1. CRIM(按城镇计算的人均犯罪率) 2. RM(每个住宅的平均房间数) 3. PTRATIO(城镇的学生与教师比例)
适合模特:
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn
lm = LinearRegression()
lm.fit(X[['CRIM']['RM'], ['PTRATIO']], boston_df.PRICE)
计算均方误差
from sklearn.metrics import mean_squared_error
y_true = ['CRIM', 'RM', 'PTRATIO']
y_pred = ['PRICE']
mean_squared_error(y_true, y_pred)
非常感谢任何建议或提示!