我有以下情况的15列数据集 9-列是绝对使用的,所以我已经将数据转换为一个热编码器
6列是数字列,由于列值在不同范围内,所以6到3列中的列具有异常值,因此我选择了RobustScaler()作为缩放功能,而我选择了标准标量。 之后,我合并了所有数据框并应用了Logistic回归算法,即使我在没有缩放的情况下获得了良好的评分,我的模型也产生了非常低的评分。
任何人都可以帮忙吗?
答案 0 :(得分:0)
请对数据框应用列标准化,然后查看输出。我想由于逻辑回归对异常值敏感,因此您面临问题
正确估算离群值,然后应用列标准化