我正在使用一维Convnet根据具有28个功能的100个时间点来预测标量值。我的问题是,我给网络进行预测的每个样本都会产生相同的答案(0.0038)。好像培训已经优化了网络以在所有培训数据上产生一个平均值。我已经在StackOverflow上阅读了许多有关此问题的文章,所以这里列出了我已经检查过的内容。
人们发现网络以这种方式收敛于单个输出还有哪些其他原因?为了解决问题,我可以采取什么方法来分解问题。欢迎所有建议!
谢谢。
朱利安
这是网络的简单版本。
model = tf.keras.models.Sequential([
tf.keras.layers.Conv1D(128, 9, activation='relu', input_shape=(100, 28)),
tf.keras.layers.MaxPooling1D(2),
tf.keras.layers.Conv1D(256, 5, activation='relu'),
tf.keras.layers.GlobalAveragePooling1D(),
tf.keras.layers.Dense(1)])