数据/特征规范化

时间:2016-07-26 15:18:30

标签: machine-learning neural-network normalization

我在区间(-1,1)内有一组功能。我正在寻找一个双射函数或一个程序,将数据标准化到一定范围,平均值接近0,方差接近1。

非常重要的是该函数是双射的,因为我需要将具有tanh激活函数的中性网络的归一化的特征作为输入。我的过程是在内存中转换数据,将它们提供给网络,并将网络结果转换回初始规模。

1 个答案:

答案 0 :(得分:2)

这种标准化任务在神经网络应用中非常常见。最常见的方法是简单地计算数据的均值和标准差,并将这些值存储在训练计划中。因此,您的数据管道是:

  1. 计算输入数据的meansd并将其存储在内存中。
  2. 应用规范化转换:normed_data = (data - mean) / sd
  3. 训练/评估/使用网络。
  4. 使用:original_data = (normed_data * sd) + mean
  5. 对数据进行非规范化

    我写了一篇关于数据规范化的文章。您可以阅读它here