我知道此站点上存在类似的问题,但是似乎没有一个问题能够充分回答我的问题。
我正在执行多元回归,以便使用享乐价格法预测房地产数据。
因变量是 AV_TOTAL ,实际上是单位公寓的价格。
距离较近的公园/高速公路的距离以米表示。
U_NUM_PARKS / U_FPLACE (存在停车场和壁炉)作为虚拟变量。
1)线性-线性模型-> Results Model 1
lm(AV_TOTAL ~ LIVINGA_AREAM2 + NUM_FLOORS +
U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS +
DIST_HIGHdiff + DIST_BIGDIG, data = data)
2)对数线性模型-> Results Model 2
lm(log(AV_TOTAL) ~ LIVINGA_AREAM2 + NUM_FLOORS +
U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS + DIST_HIGHdiff + DIST_BIGDIG, data = data)
3)日志日志模型-> Results Model 3
lm(formula = log(AV_TOTAL) ~ log(LIVINGA_AREAM2) + NUM_FLOORS +
U_BASE_FLO + log(U_BDRMS) + factor(U_NUM_PARK) + log(DIST_PARKS) +
log(DIST_HIGHdiff) + log(DIST_BIGDIG), data = data)
所有模型的R ^ 2都很好,而残差图显示模型2和3的正态分布更好。
我不知道模型2和3之间的区别是什么,特别是在解释变量DIST_PARKS
(距公园的距离)时,哪个更正确。