我是机器学习的新手,我正在使用kaggle.com的房价数据集来解决回归问题。我想知道相关系数和相关确定之间的区别,以及人们为什么使用一个相对另一个。例如,我可以看到YearBuild和SalePrice之间的关系,像这样
现在,系数确定有什么用,为什么要用
如果R =系数归因 然后系数确定= R x R
答案 0 :(得分:1)
系数R squared
告诉您回归模型可以解释多少方差。例如,如果它等于0.01
,则意味着您已经解释了方差的百分之一。由于明显的原因,这很有用。与相关系数不同,R squared
始终为正,因此仅告诉您存在(或不存在)线性关系,但不知道其形式是什么。