我是机器学习的新手,对ML库的经验很少。我正在开发一个神经网络来预测给定输入数组的数字数组。所以我的输入如下:
输入到神经网络的是长度为100的数组。
输出:
模型的输出是长度为60的数组。
到目前为止,我在这里发布了我的代码。目前无法使用。有人可以帮助我以正确的方式做到这一点吗?
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(100,)))
model.add(tf.keras.layers.Dense(768, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(768, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(60, activation=tf.nn.softmax))
model.compile(optimizer = 'adam',
loss = 'sparse_categorical_crossentropy',
metrices = ['accuracy'])
model.fit(x_train_new, y_train_new, epochs = 20)
注意::x_train_new
是长度为100的数组的数组,y_train_new
是长度为60的数组的数组。
运行此命令并致电model.fit()
时,将出现以下错误。
ValueError Traceback (most recent call last)
<ipython-input-62-33e8f1dfe4c8> in <module>()
5 # print(y_train_new.shape)
6
----> 7 model.fit(x_train_new, y_train_new, epochs = 20)
/home/vajira/tf_cpu_py3/lib/python3.6/site-packages/tensorflow/python/keras/engine/training.py in fit(self, x, y, batch_size, epochs, verbose, callbacks, validation_split, validation_data, shuffle, class_weight, sample_weight, initial_epoch, steps_per_epoch, validation_steps, **kwargs)
1276 steps_name='steps_per_epoch',
1277 steps=steps_per_epoch,
-> 1278 validation_split=validation_split)
1279
1280 # Prepare validation data.
/home/vajira/tf_cpu_py3/lib/python3.6/site-packages/tensorflow/python/keras/engine/training.py in _standardize_user_data(self, x, y, sample_weight, class_weight, batch_size, check_steps, steps_name, steps, validation_split)
915 feed_output_shapes,
916 check_batch_axis=False, # Don't enforce the batch size.
--> 917 exception_prefix='target')
918
919 # Generate sample-wise weight values given the `sample_weight` and
/home/vajira/tf_cpu_py3/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_utils.py in standardize_input_data(data, names, shapes, check_batch_axis, exception_prefix)
189 'Error when checking ' + exception_prefix + ': expected ' +
190 names[i] + ' to have shape ' + str(shape) +
--> 191 ' but got array with shape ' + str(data_shape))
192 return data
193
ValueError: Error when checking target: expected dense_14 to have shape (1,) but got array with shape (60,)
答案 0 :(得分:3)
您必须为第一层指定输入形状:
model.add(tf.keras.layers.Flatten(input_shape=(100,)))
但是,如果输入是长度为100的向量,则不需要Flatten
层,因为它已经被拉平。相反,请为第一input_shape
层设置Dense
,然后删除Flatten
层。
更新:关于形状不匹配错误,请使用categorical_crossentropy
作为损失函数并传递大小为60的单编码编码标签,或使用sparse_categorical_crossentropy
并传递整数标签(即0或1或2等)。不要将这两件事混在一起:当前,您正在使用sparse_categorical_crossentropy
,并将一键编码的标签传递给fit()
方法。因此,您会收到形状不匹配错误。
旁注:,如评论中提到的@Alexis,请添加在提问时遇到的错误(如果适用)。