Keras逐批将数据加载到GPU上(作者here注明)。
对于小型数据集,这是非常低效的。有没有办法修改Keras或直接调用Theano函数(在Keras中定义模型后)以允许所有批次预先移动到GPU,并使用GPU内存中已有的批次进行训练?
(几个星期前有人问同一个问题on the Keras list,但到目前为止没有回复。)
答案 0 :(得分:1)
只需将数据硬连接到模型中,作为不可训练的嵌入矩阵(使用自定义初始化程序嵌入图层)。然后,您将一堆索引传递给model.fit方法,而不是训练数据。