我正在研究线性回归住房数据集。
我正在获取目标变量的日志,例如
df['SalePrice']=np.log(df['SalePrice'])
然后我以结果的指数来计算损失为
lin_mse = mean_squared_error(np.exp(housing_predictions), np.exp(y_test))
lin_rmse = np.sqrt(lin_mse)
我遇到了一个很大的错误。之前我大约是23岁,但之后却是22723岁!不使用np.exp,我得到0.1,但是我想与以前的值进行比较。怎么了?