我设置了featurewise_center = True
,然后使用flow_from_directory
在keras中设置了我的训练和验证数据。但是,我得到了错误
UserWarning: This ImageDataGenerator specifies `featurewise_center`,
but it hasn't been fit on any training data. Fit it first by calling `.fit(n
numpy_data)`
有什么方法可以使用flow_from_directory
然后根据需要调整数据吗?
答案 0 :(得分:0)
featurewise_center
将图像转换为0均值。这是通过使用公式
X = X-均值(X)
但是对于ImageDataGenerator
进行此转换,它需要知道数据集的平均值,并且fit
上的ImageDataGenerator
方法确实执行了计算这些统计信息的操作。
根据keras docs的解释
使数据生成器适合一些样本数据。这计算 与数据相关转换相关的内部数据统计信息, 基于样本数据数组。
如果可以将数据集完全加载到内存中,则可以通过将所有图像加载到numpy数组中并在其上运行fit
来实现。
示例代码(256x256的RGB图像):
from keras.layers import Input, Dense, Flatten, Conv2D
from keras.models import Sequential
from keras.preprocessing.image import ImageDataGenerator
import numpy as np
from pathlib import Path
from PIL import Image
height = width = 256
def read_pil_image(img_path, height, width):
with open(img_path, 'rb') as f:
return np.array(Image.open(f).convert('RGB').resize((width, height)))
def load_all_images(dataset_path, height, width, img_ext='png'):
return np.array([read_pil_image(str(p), height, width) for p in
Path(dataset_path).rglob("*."+img_ext)])
train_datagen = ImageDataGenerator(featurewise_center=True)
train_datagen.fit(load_all_images('./images/', height, width))
train_generator = train_datagen.flow_from_directory(
'./images/',
target_size=(height, width),
batch_size=32,
class_mode='binary',
color_mode='rgb')
model = Sequential()
model.add(Conv2D(1,(3,3), input_shape=(height,width,3)))
model.add(Flatten())
model.add(Dense(1))
model.compile('adam', 'binary_crossentropy')
model.fit_generator(train_generator)
但是,如果无法将数据完全加载到内存中怎么办?一种方法是从数据集中随机采样图像。
通常,我们仅使用mean
训练数据来进行均一化,而对均化验证/测试数据使用相同的均值。通过datagenerator
执行相同操作会有些棘手。