基本神经网络预测?

时间:2017-10-03 01:13:14

标签: python machine-learning neural-network keras

我正在从https://machinelearningmastery.com/tutorial-first-neural-network-python-keras/看这个非常基本的神经网络。我用随机数组和随机标签替换了所使用的数据。

我假设因为输入是随机的,预测应该是0.50左右,加或减一点。但是,当我这样做时,我得到了

[0.49525392, 0.49652839, 0.49729034, 0.49670222, 0.49342978, 0.49490061, 0.49570397, 0.4962129, 0.49774086, 0.49475089, 0.4958384, 0.49506786, 0.49696651, 0.49869373, 0.49537542, 0.49613148, 0.49636957, 0.49723724]

大约是0.50,但永远不会过去。它适用于我使用的任何随机种子,所以它不仅仅是巧合。对此行为的任何解释?

# Create first network with Keras
from keras.models import Sequential
from keras.layers import Dense
import numpy as np

np.random.seed(90)

X_train = np.random.rand(18,61250)
X_test = np.random.rand(18,61250)
Y_train = np.array([0.0, 1.0, 1.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 
    0.0, 1.0, 0.0, 0.0, 1.0, 0.0, 0.0, 0.0, 1.0,])
Y_test = np.array([1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 1.0, 1.0, 1.0, 
    1.0, 0.0, 0.0, 0.0, 1.0, 0.0, 0.0, 1.0, 0.0,])

_, input_size = X_train.shape

# create model
model = Sequential()
model.add(Dense(12, input_dim=input_size, init='uniform', activation='relu'))
model.add(Dense(8, init='uniform', activation='relu'))
model.add(Dense(1, init='uniform', activation='sigmoid'))

# Compile model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# calculate predictions
predictions = model.predict(X_test)
preds = [x[0] for x in predictions]
print(preds)

# Fit the model
model.fit(X_train, Y_train, epochs=100, batch_size=10,  verbose=2, validation_data=(X_test,Y_test))

1 个答案:

答案 0 :(得分:2)

我不知道这是否能准确回答你的问题,但我一直在玩 用你的代码,并决定尝试一些东西。您的X数据在0之间生成 和1,所以我尝试在0到10之间生成它。这是一个样本 结果预测:

[0.53419214, 0.55088341, 0.53190422, 0.52382213, 0.53469753, 0.53098464,
0.51968938, 0.53249627, 0.52852863, 0.52497149, 0.52816379, 0.5457474,
0.52565753, 0.5276686, 0.52042121, 0.52128422, 0.52535951, 0.52730507]

正如您所看到的,它现在产生的结果超过0.5。因为你预测了     在进行任何培训之前输出,预测将完成     随机权重。可能是网络还没有调整到     输入向量的分布?

这些是训练后的预测:

[0.43440229, 0.48104468, 0.49194154, 0.4766106, 0.50065982, 0.47388917,
0.51052755, 0.50618082, 0.48478326, 0.4846094, 0.50018799, 0.4800632,
0.4181695, 0.48307362, 0.5063237, 0.50420266, 0.47321039, 0.44235682]

预测现在或多或少都是平衡的。我得到了这种     两个输入分布的输出。我认为这是一个问题     随机初始化的网络非常依赖于分布     你的输入数据。训练后,它会正常化。