我在神经网络上工作,以预测事件是否是中微子。 每个输入x是一个矩阵:(3,5484),三个不同的度量,5484个传感器。
所以我应该规范化网络的输入才能正常工作,但我对此有疑问,让我们解释一下:
我的数据集是:(x_1,....,x_N)。让我们只关注一个特征,并认为x是一个大小的向量(5484)。 然后每个x都有一个平均值:mean_x和一个std:std_x 但归一化输入的重点是重新缩放它而不会丢失信息(全局归一化,每个输入的归一化因子相同)吗?
所以,我不确定如何重新缩放它。我应该将(x_1,..,x_N)展平为1-D向量:(x_1,...,x_5484 * N)并计算其均值和标准差?
或者我应该独立对待每个5484个输入通道吗?
我有点迷路了。答案 0 :(得分:0)
这取决于您如何处理传感器数据。
如果您认为5484传感器代表不同的功能,则不应将它们展平,并应将 3 * 5484 视为图像通道。否则,如果传感器相似,则应将它们弄平。
但直观地说,我认为第一种方法更好。
答案 1 :(得分:0)
如果3个传感器彼此独立,则具有5484 * 3功能。 对于每个功能,您应该扁平化并标准化数据。
例如,您的全部数据集可能是m *(5484 * 3)的矩阵,其中m是样本数。矩阵中的每一行都是一个样本。
你可以使用scipy http://scikit-learn.org/stable/modules/preprocessing.html