我正在学习keras。我的目标是创建一个预测函数值的简单模型。首先,我创建了两个数组,一个用于X值,另一个用于相应的Y值。
# declare and init arrays for training-data
X = np.arange(0.0, 10.0, 0.05)
Y = np.empty(shape=0, dtype=float)
# Calculate Y-Values
for x in X:
Y = np.append(Y, float(0.05*(15.72807*x - 7.273893*x**2 + 1.4912*x**3 - 0.1384615*x**4 + 0.00474359*x**5)))
然后我创建并训练模型
# model architecture
model = Sequential()
model.add(Dense(1, input_shape=(1,)))
model.add(Dense(5))
model.add(Dense(1, activation='linear'))
# compile model
model.compile(loss='mean_absolute_error', optimizer='adam', metrics=['accuracy'])
# train model
model.fit(X, Y, epochs=150, batch_size=10)
使用模型预测值
# declare and init arrays for prediction
YPredict = np.empty(shape=0, dtype=float)
# Predict Y
YPredict = model.predict(X)
# plot training-data and prediction
plt.plot(X, Y, 'C0')
plt.plot(X, YPredict, 'C1')
# show graph
plt.show()
我得到了这个输出(蓝色是训练数据,橙色是预测):
我做错了什么?我想这是网络架构的一个基本问题,对吧?
答案 0 :(得分:3)
问题确实存在于您的网络架构中。具体来说,您在所有层中使用线性激活:这意味着网络只能适合线性函数。您应该在输出层中保持线性激活,但是您应该在隐藏层中使用ReLU激活:
model.add(Dense(1, input_shape=(1,)))
model.add(Dense(5, activation='relu'))
model.add(Dense(1, activation='linear'))
然后,玩隐藏图层的数量/大小;我建议你多用一些。
答案 1 :(得分:2)
除了BlackBear提供的答案之外:
在将输入X输入到神经网络之前,您应该规范化输入X和输出Y:
# Feature Scaling (ignore possible warnings due to conversion of integers to floats)
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X)
sc_Y = StandardScaler()
Y_train = sc_Y.fit_transform(Y)
# [...]
model.fit(X_train, Y_train, ...)
请参阅this answer,了解如果您没有,在与您的回归设置非常相似的回归设置中会发生什么。请记住,您应该使用sc_X
类似地缩放任何测试数据;另外,如果您稍后需要将模型生成的任何predictions
缩放回Y的原始比例,则应使用
sc_Y.inverse_transform(predictions)
在像你这样的回归设置中,准确性没有意义;你应该从模型编译中删除metrics=['accuracy']
(损失本身就足以作为一个指标)