标签: machine-learning linear-regression data-science categorical-data supervised-learning
我正在尝试对主要是分类的数据拟合线性回归模型。 rmse值在7左右。如何确定分类变量的rmse范围?
除误差值外,衡量模型性能的最佳方法是什么?只是根据测试数据绘制预测吗?
这是一个新的数据集,我正在尝试从头开始获取见解。 对于此类问题的笔记本或代码(分类数据上的线性回归模型)的任何链接将不胜感激。
我分别使用了sklearn功能哈希和pd.get_dummies