keras中叠加去噪自动编码器的预测误差

时间:2018-04-06 09:53:19

标签: python keras autoencoder valueerror

我用keras训练了一个堆叠的去噪自动编码器。在预测新样品之前,每件事情都很好。用于预测的样本被命名为“活动”部分,我对训练部分进行了必要的预处理和归一化,并且我以相同的方式添加了噪声。

这是去噪自动编码器:

checkpointer = ModelCheckpoint(filepath="modelyes.h5",
                               verbose=0,
                               save_best_only=True,
                               save_weights_only=True)
tensorboard = TensorBoard(log_dir='/tmp/autoencoder',
                          histogram_freq=0,
                          write_graph=True,
                          write_images=True)
input_enc = Input(shape=(input_size,))
hidden_1 = Dense(hidden_size1, activation='relu')(input_enc)
hidden_11 = Dense(hidden_size2, activation='relu')(hidden_1)
code = Dense(code_size, activation='relu')(hidden_11)
hidden_22 = Dense(hidden_size2, activation='relu')(code)
hidden_2 = Dense(hidden_size1, activation='relu')(hidden_22)
output_enc = Dense(input_size, activation='tanh')(hidden_2)
D_autoencoder_yes = Model(input_enc, output_enc)

D_autoencoder_yes.compile(optimizer='adam',
                         loss='mean_squared_error', 
                         metrics=['accuracy'])
history_D_yes = D_autoencoder_yes.fit(df_noised_noy_norm_y, df_noyau_norm_y,
                               epochs=200,
                                batch_size=batch_size,
                                shuffle = True,
                                validation_data=(df_noised_test_norm_y, df_test_norm_y),
                                verbose=1, 
                                callbacks=[checkpointer, tensorboard]).history
D_autoencoder_yes.save_weights("modelyes.h5")
D_autoencoder_yes.load_weights("modelyes.h5")

以下是预测脚本:

predicted_active = D_autoencoder_yes.predict(df_noised_active_norm)
print(predicted_active.tolist())

以下是我如何将噪音添加到活动部分:

mu, sigma = 2, 3
np.random.seed(42)
noise_active = np.random.normal(mu, sigma, [10000,48])
noised_active = df_active + noise_active

生成的 ERROR

ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

我对活动部分进行了预处理,但我不明白问题出在哪里。

1 个答案:

答案 0 :(得分:0)

可能是您的某些输入数据丢失了。 您可以使用以下行进行检查:如果得到True,则数据具有NaN。您需要再次检查数据。

`print(df.isnull().values.any()) #check missing values`

如果您为False,则数据正常。