我正在使用tensorflow 2.0 API,其中我从所有图像路径(如下面的示例)创建了数据集
X_train, X_test, y_train, y_test = train_test_split(all_image_paths, all_image_labels, test_size=0.20, random_state=32)
path_train_ds = tf.data.Dataset.from_tensor_slices(X_train)
image_train_ds = path_train_ds.map(load_and_preprocess_image, num_parallel_calls=AUTOTUNE)
但是,当我运行此代码以使用keras ImageDataGenerator应用一些参数化时,我遇到了错误
datagen=tf.keras.preprocessing.image.ImageDataGenerator(featurewise_center=True,
featurewise_std_normalization=True,
rotation_range=20,
width_shift_range=0.2,
height_shift_range=0.2,
horizontal_flip=True)
datagen.fit(image_train_ds)
错误:
/usr/local/lib/python3.6/dist-packages/keras_preprocessing/image/image_data_generator.py in fit(self, x, augment, rounds, seed)
907 seed: Int (default: None). Random seed.
908 """
--> 909 x = np.asarray(x, dtype=self.dtype)
910 if x.ndim != 4:
911 raise ValueError('Input to `.fit()` should have rank 4. '
/usr/local/lib/python3.6/dist-packages/numpy/core/numeric.py in asarray(a, dtype, order)
499
500 """
--> 501 return array(a, dtype, copy=False, order=order)
502
503
TypeError: float() argument must be a string or a number, not 'ParallelMapDataset'
答案 0 :(得分:5)
tf.keras.preprocessing.image.ImageDataGenerator
不适用于tf.data.Dataset
对象,它被设计为可以处理普通的旧图像。
如果您想应用扩充,则必须使用tf.data.Dataset
对象本身(通过各种.map
调用),也可以在使用{创建了扩充数据集之后创建tf.data.Dataset
对象{1}}。