CNN:数据标准化?

时间:2017-06-26 21:14:33

标签: arrays matrix neural-network standardized

我在神经网络上工作,以预测事件是否是中微子。 每个输入x是一个矩阵:(3,5484),三个不同的度量,5484个传感器。

所以我应该规范化网络的输入才能正常工作,但我对此有疑问,让我们解释一下:

我的数据集是:(x_1,....,x_N)。让我们只关注一个特征,并认为x是一个大小的向量(5484)。 然后每个x都有一个平均值:mean_x和一个std:std_x 但归一化输入的重点是重新缩放它而不会丢失信息(全局归一化,每个输入的归一化因子相同)吗?

所以,我不确定如何重新缩放它。我应该将(x_1,..,x_N)展平为1-D向量:(x_1,...,x_5484 * N)并计算其均值和标准差?

或者我应该独立对待每个5484个输入通道吗?

我有点迷路了。

2 个答案:

答案 0 :(得分:0)

这取决于您如何处理传感器数据。

如果您认为5484传感器代表不同的功能,则不应将它们展平,并应将 3 * 5484 视为图像通道。否则,如果传感器相似,则应将它们弄平。

但直观地说,我认为第一种方法更好。

答案 1 :(得分:0)

如果3个传感器彼此独立,则具有5484 * 3功能。 对于每个功能,您应该扁平化并标准化数据。

例如,您的全部数据集可能是m *(5484 * 3)的矩阵,其中m是样本数。矩阵中的每一行都是一个样本。

你可以使用scipy http://scikit-learn.org/stable/modules/preprocessing.html