为什么Keras fit_generator()在实际“训练”之前加载

时间:2018-12-14 12:38:02

标签: python tensorflow keras deep-learning

很抱歉打扰:

我对keras函数感到困惑:fit_generator

我使用自定义生成器生成(图像,seg_image) 培训

仔细查看,您可以看到get_seg()函数的内部

我将print(path)和路径放在 读取图像的路径

从数据中,我想知道的另一件事是

fit_generator()从生成器获取数据

#import all the stuff
def get_seg(#parameters ):
    print(path) #to track when this function is called 
    return seg_image     #for training 

#pre-processing image 
def getimage(#parameters):
    #do something to image
    return the imgage      #for training

def data_generator():
#load all the data for training 
    zipped =cycle(zip(images,segmentations))
    while True:
        X = []
        Y = []
        for _ in range(batch_size) :
            im , seg = next(zipped)
            X.append(getimage(#parameters))  
            Y.append(get_seg(#parameters))
    yield np.array(X) , np.array(Y) 

#create an generator 
G = data_generator(#parameters) 
#start training
for ep in range( epochs ):
    m.fit_generator( G , steps_per_epoch=512, 
                     epochs=1,workers=1)

当我开始训练时,我得到了真正意想不到的结果

通过培训:终端看起来像: 它打印出24套路径

从定制data_generator中获取数据的拳头

data/train/0000_mask.png
data/train/0001_mask.png
data/train/0002_mask.png
data/train/0003_mask.png
data/train/0004_mask.png
data/train/0005_mask.png
data/train/0006_mask.png
data/train/0007_mask.png
data/train/0008_mask.png
data/train/0009_mask.png
data/train/0010_mask.png
data/train/0011_mask.png
data/train/0012_mask.png
data/train/0013_mask.png
data/train/0014_mask.png
data/train/0015_mask.png
data/train/0016_mask.png
data/train/0017_mask.png
data/train/0018_mask.png
data/train/0019_mask.png
data/train/0020_mask.png
data/train/0021_mask.png
data/train/0022_mask.png
data/train/0023_mask.png

然后: 我相信培训从这里开始。

1/512 [..............................] - ETA: 2:14:34 - loss: 2.5879 - acc: 0.1697

再次加载数据(图像)

data/train/0024_mask.png
data/train/0025_mask.png

512(steps_per_epoch)之后,表示下一轮训练

开始,它只会在训练前打印下一个24条路径。

我想知道为什么会这样吗?这就是keras

有效吗?在实际通过之前加载数据是通过网络进行的?

还是我误解或错过了一些基础知识?

1 个答案:

答案 0 :(得分:1)

是的,这是Keras的工作方式。

训练和加载是两个并行的动作。一个人看不到另一人的状况。

fit_generator方法中有一个max_queue_size参数,默认情况下通常等于10。这意味着生成器将全速加载数据,直到队列已满。因此,您需要提前加载许多图像(这样可以避免模型因加载而变慢)

培训仅检查:队列中是否有项目?好火车

您要打印的批次要多,因为您在循环内调用get_seg,而在此循环外仅调用yield