我有一个包含11个功能的数据集,其范围如下:
1000001 < feature 1 < 1560504
10000 < feature 2 < 15151
1 < feature 3 < 8
1001 < feature 4 < 3051
100 < feature 5 < 136
100 < feature 6 < 323
1 < feature 7 < 179
0 < feature 8 < 23
0 < feature 9 < 60034
114206 < feature 10 < 5318251
30 < feature 11 < 356
和一个布尔输出。
我想对这个数据集使用反向传播神经网络 如何规范化输入?
答案 0 :(得分:0)
每个功能都可以独立标准化。
x_i = (x_i - mean(x))/sigma(x) where x is a feature
此外,您需要为每个要素存储均值和sigma,并在预测之前对测试/新数据使用相同的值。
如果您使用的是Scikit等,则可以使用标准预处理包: http://scikit-learn.org/stable/modules/preprocessing.html