如果我要对训练数据进行数据预处理,是否有必要对测试数据进行相同的处理?

时间:2018-09-21 03:21:32

标签: machine-learning normalization training-data data-cleaning

例如,如果我找到训练数据的meanvariancenormalize,是否应该将相同的meanvariance用于测试数据,还是应该找到测试数据的meanvariance

1 个答案:

答案 0 :(得分:2)

您应使用培训数据中使用的均值和方差。这样可以确保两组数据的处理方法都相同,不应使用看不见的(测试)组数据均值/方差。