带有tf.data.Dataset的有效网络输入形状错误

时间:2020-04-24 21:43:07

标签: tensorflow keras efficientnet

输入tf.data.Dataset训练EfficientnetB0模型时,出现以下错误:

ValueError: in converted code:

    C:\Users\fconrad\AppData\Local\Continuum\anaconda3\envs\venv_spielereien\lib\site-packages\tensorflow_core\python\keras\engine\training_v2.py:677 map_fn
        batch_size=None)
    C:\Users\fconrad\AppData\Local\Continuum\anaconda3\envs\venv_spielereien\lib\site-packages\tensorflow_core\python\keras\engine\training.py:2410 _standardize_tensors
        exception_prefix='input')
    C:\Users\fconrad\AppData\Local\Continuum\anaconda3\envs\venv_spielereien\lib\site-packages\tensorflow_core\python\keras\engine\training_utils.py:573 standardize_input_data
        'with shape ' + str(data_shape))

    ValueError: Error when checking input: expected efficientnet-b0_input to have 4 dimensions, but got array with shape (224, 224, 3)

我真的想知道为什么会发生这种情况,因为当我从数据集创建批次时:

train_generator = (tf.data.Dataset
                  .from_tensor_slices((train_imgs, train_labels))
                  .map(read_img)
                  .map(flip_img)
                  .map(brightness)
                  .map(blur)
                  .map(noise)
                   .map(rotate_90)
                  .repeat()
                  .shuffle(512)
                  .batch(BATCH_SIZE)
                  .prefetch(True))

validation_generator = (tf.data.Dataset
                       .from_tensor_slices((validation_imgs, validation_labels))
                       .map(read_img)
                       )

print(train_generator.__iter__().__next__()[0].shape)

我得到了预期的结果(64、224、224、3)。

但是在创建模型之后,当我开始训练时,上面的错误就会出现:

effn = tfkeras.EfficientNetB0(include_top=False, input_shape=img_shape, classes=4)
effn_model = tf.keras.Sequential()
effn_model.add(effn)
effn_model.add(tf.keras.layers.GlobalAveragePooling2D())
effn_model.add(tf.keras.layers.Dense(4, 'softmax'))

effn_model.compile(optimizer= 'adam', loss='categorical_crossentropy', metrics= ['categorical_accuracy'])

effn_model.fit(train_generator,
               epochs=20,
               steps_per_epoch=train_imgs.shape[0] // BATCH_SIZE,
               validation_data= validation_generator)

有人知道为什么数据集中的切片具有形状(64,224,224,3),但是模型无法识别批次尺寸吗?当我尝试训练keras.application模型时,一切正常。 我使用tensorflow 2.1和有效网络的pip安装。谢谢

1 个答案:

答案 0 :(得分:0)

如此处所述keras.io/api/applications/efficientnet/

input_shape:可选形状元组,仅在 include_top 为 False 时指定。 它应该正好有 3 个输入通道。

所以试试这个->

from tensorflow.keras.applications.efficientnet import EfficientNetB0, EfficientNetB5
mm = EfficientNetB0(include_top=True, weights=None, input_tensor=None, input_shape=(128, 128, 3), pooling=None, classes=2, classifier_activation="sigmoid")
mm.summary()

注意 input_shape=(128, 128, 3) 它有 3 个通道。