我正在使用神经网络构建一个函数逼近器,该函数可以基于辐射流体动力学来计算电磁波在大气中的传播。输入是相对于高度的一组物理参数列,例如温度,压力等。输出是一条线的频谱。该体系结构看起来像自动编码器。我的问题是我应该在Keras中选择哪个损失和优化程序作为起点?为什么呢?
y0 = Input(shape=(112,))
y1 = Dense(100, activation='relu',name='y1')(y0)
y2 = Dense(20, activation='relu',name='y2')(y1)
y3 = Dense(100, activation='relu',name='y3')(y2)
y4 = Dense(251, activation='sigmoid',name='y4')(y3)
merged = Model(inputs=y0,outputs=y4)
merged.compile(optimizer='adam', loss='mean_squared_error',
metrics=['accuracy'])
我从“ MSE”作为损失(因为这是一个回归问题)开始,以“ adam”作为优化程序开始。但是我的准确性没有超过0.52。在训练之前,我已经对数据进行了归一化,并且也尝试使用其他batch_size。目前,我的训练样本为200,000,并将纪元设置为100。