标签: pandas keras dataset normalization
我正在使用Keras(TF2.0beta)模型来处理自定义数据集。训练数据集具有约400条记录,8列/功能,1个标签。我的目标是训练和使用单独的验证数据集预测标签。重要功能是float32,但范围有很大不同。
许多在线示例将每个功能标准化为0-1。一些示例使用(X-Xmean)/ Xstd统计标准化每个功能。 (FWIW,熊猫是白魔法!)
我思考我想标准化功能。跨功能进行规范化只会使我看来是个学习错误。
那我什么时候应该统计归一化,什么时候应该统计特征归一化?