我试图预测悉尼的房价,在进行数据处理后,我发现使用对数无法对价格进行归一化。但是我仍然继续构建提升模型。问题是: 登录后如何调整残差?这意味着我认为对数会使残差/误差更大。 谢谢
# normal distribution of train response value
log=np.log(training_data["price"])
skew = stats.skew(log)
print(skew)
k2, p = stats.normaltest(log)
alpha = 1e-3
print("p = {:g}".format(p))
if p < alpha: # null hypothesis: x comes from a normal distribution
print("The null hypothesis can be rejected")
else:
print("The null hypothesis cannot be rejected")
结果是p = 4.07145e-07 原假设可以被拒绝