我正在尝试在Apache Spark上训练使用Keras构建的自动编码器。我的输入和输出层具有相同的形状(12,)
。考虑到这一点,我尝试使用Keras2DML包装器:
from systemml.mllearn import Keras2DML
...
epochs = 1000
batch_size = 512
samples = data.shape[0]
max_iter = int(epochs*math.ceil(samples/batch_size))
sysml_model = Keras2DML(spark, keras_model, input_shape=(?,?,?),
weights='weights_dir', batch_size=batch_size,
max_iter=max_iter, test_interval=0, display=10)
sysml_model.fit(data.values,data.values)
我应该使用input_shape
的哪个值?我不明白为什么无法通过查看keras_model
的输入层来自动确定它,或者为什么它必须具有长度3 ...