如何在keras ImageDataGenerator中使用Tensorflow2.0数据集

时间:2019-04-10 15:14:07

标签: keras tensorflow2.0

我正在使用tensorflow 2.0 API,其中我从所有图像路径(如下面的示例)创建了数据集

X_train, X_test, y_train, y_test = train_test_split(all_image_paths, all_image_labels, test_size=0.20, random_state=32)

path_train_ds = tf.data.Dataset.from_tensor_slices(X_train)
image_train_ds = path_train_ds.map(load_and_preprocess_image, num_parallel_calls=AUTOTUNE)

但是,当我运行此代码以使用keras ImageDataGenerator应用一些参数化时,我遇到了错误

datagen=tf.keras.preprocessing.image.ImageDataGenerator(featurewise_center=True,
        featurewise_std_normalization=True,
        rotation_range=20,
        width_shift_range=0.2,
        height_shift_range=0.2,
        horizontal_flip=True)
datagen.fit(image_train_ds)

错误:

 /usr/local/lib/python3.6/dist-packages/keras_preprocessing/image/image_data_generator.py in fit(self, x, augment, rounds, seed)
    907             seed: Int (default: None). Random seed.
    908        """
--> 909         x = np.asarray(x, dtype=self.dtype)
    910         if x.ndim != 4:
    911             raise ValueError('Input to `.fit()` should have rank 4. '

/usr/local/lib/python3.6/dist-packages/numpy/core/numeric.py in asarray(a, dtype, order)
    499 
    500     """
--> 501     return array(a, dtype, copy=False, order=order)
    502 
    503 

TypeError: float() argument must be a string or a number, not 'ParallelMapDataset'

1 个答案:

答案 0 :(得分:5)

tf.keras.preprocessing.image.ImageDataGenerator不适用于tf.data.Dataset对象,它被设计为可以处理普通的旧图像。

如果您想应用扩充,则必须使用tf.data.Dataset对象本身(通过各种.map调用),也可以在使用{创建了扩充数据集之后创建tf.data.Dataset对象{1}}。