线性回归的回归分析

时间:2019-03-05 00:37:57

标签: python machine-learning sklearn-pandas

我有一个回归模型,其中我的目标变量(天)的定量值在2到30之间。我的RMSE为2.5,所有其他X变量(标称)都是分类的,因此我将其虚拟编码。 我想知道RMSE的高价值是什么?我想得到的东西在1-1.5甚至更低的范围内,但我不知道要实现相同的目标应该做什么。

注意#我已经尝试过选择功能,删除功能的重要性会降低。

任何想法都会受到赞赏。

1 个答案:

答案 0 :(得分:0)

如果您的x值是分类的,则将它们绑定到统一网格并不一定有意义。谁说类别A和类别B应该与类别B和类别C隔开相同的距离。假设它们只会导致错误表示您的结果。

由于比例尺的选择是未知数,因此在可视化方面,最好将统一的x网格设置为日数,然后查看如果给出线性关系,则类别在y比例尺上的位置。 / p>

如果您没有x和y的定量数据,根本就不会出现RMS错误。