我有一个回归模型,其中我的目标变量(天)的定量值在2到30之间。我的RMSE为2.5,所有其他X变量(标称)都是分类的,因此我将其虚拟编码。 我想知道RMSE的高价值是什么?我想得到的东西在1-1.5甚至更低的范围内,但我不知道要实现相同的目标应该做什么。
注意#我已经尝试过选择功能,删除功能的重要性会降低。
任何想法都会受到赞赏。
答案 0 :(得分:0)
如果您的x值是分类的,则将它们绑定到统一网格并不一定有意义。谁说类别A和类别B应该与类别B和类别C隔开相同的距离。假设它们只会导致错误表示您的结果。
由于比例尺的选择是未知数,因此在可视化方面,最好将统一的x网格设置为日数,然后查看如果给出线性关系,则类别在y比例尺上的位置。 / p>
如果您没有x和y的定量数据,根本就不会出现RMS错误。