我正在使用前馈机器学习算法构建预测模型,并且通过将其训练在0到1之间以改善学习效果,我学到了很多有关预处理训练数据(转换数据)的知识。 我的问题是:我应该转换数据的训练样本(输入)和标签(输出)还是仅转换数据样本?
答案 0 :(得分:0)
您应该只预处理训练数据,如果需要的话,将使用测试数据或现实生活数据来对模型进行推断。 您只是通过在0和1之间进行转换来标准化数据。这样做是为了获得相同比例(均质性)的数据值。另外,在训练和测试数据上保持方差相同
TL; DR:仅将训练样本和测试数据标准化,而不是标签