很抱歉打扰:
我对keras函数感到困惑:fit_generator
我使用自定义生成器生成(图像,seg_image) 培训
仔细查看,您可以看到get_seg()
函数的内部
我将print(path)
和路径放在
读取图像的路径
从数据中,我想知道的另一件事是
fit_generator()
从生成器获取数据
#import all the stuff
def get_seg(#parameters ):
print(path) #to track when this function is called
return seg_image #for training
#pre-processing image
def getimage(#parameters):
#do something to image
return the imgage #for training
def data_generator():
#load all the data for training
zipped =cycle(zip(images,segmentations))
while True:
X = []
Y = []
for _ in range(batch_size) :
im , seg = next(zipped)
X.append(getimage(#parameters))
Y.append(get_seg(#parameters))
yield np.array(X) , np.array(Y)
#create an generator
G = data_generator(#parameters)
#start training
for ep in range( epochs ):
m.fit_generator( G , steps_per_epoch=512,
epochs=1,workers=1)
当我开始训练时,我得到了真正意想不到的结果
通过培训:终端看起来像: 它打印出24套路径
从定制data_generator
中获取数据的拳头
data/train/0000_mask.png
data/train/0001_mask.png
data/train/0002_mask.png
data/train/0003_mask.png
data/train/0004_mask.png
data/train/0005_mask.png
data/train/0006_mask.png
data/train/0007_mask.png
data/train/0008_mask.png
data/train/0009_mask.png
data/train/0010_mask.png
data/train/0011_mask.png
data/train/0012_mask.png
data/train/0013_mask.png
data/train/0014_mask.png
data/train/0015_mask.png
data/train/0016_mask.png
data/train/0017_mask.png
data/train/0018_mask.png
data/train/0019_mask.png
data/train/0020_mask.png
data/train/0021_mask.png
data/train/0022_mask.png
data/train/0023_mask.png
然后: 我相信培训从这里开始。
1/512 [..............................] - ETA: 2:14:34 - loss: 2.5879 - acc: 0.1697
再次加载数据(图像)
data/train/0024_mask.png
data/train/0025_mask.png
512(steps_per_epoch)之后,表示下一轮训练
开始,它只会在训练前打印下一个24条路径。
我想知道为什么会这样吗?这就是keras
有效吗?在实际通过之前加载数据是通过网络进行的?
还是我误解或错过了一些基础知识?
答案 0 :(得分:1)
是的,这是Keras的工作方式。
训练和加载是两个并行的动作。一个人看不到另一人的状况。
在fit_generator
方法中有一个max_queue_size
参数,默认情况下通常等于10。这意味着生成器将全速加载数据,直到队列已满。因此,您需要提前加载许多图像(这样可以避免模型因加载而变慢)
培训仅检查:队列中是否有项目?好火车
您要打印的批次要多,因为您在循环内调用get_seg
,而在此循环外仅调用yield
。