如何训练不同维度的数据

时间:2020-03-20 03:42:07

标签: tensorflow tensorflow2.0 tensorflow-datasets

我想根据不同的数据集训练模型。数据集由不同维度的数据组成。例如,在NLP中,句子的长度不同。为了不浪费计算资源,我不想填充0以使它们具有相同的尺寸。我该怎么办?

我尝试了多种方法。

  1. 用于循环。我的伪代码如下:
model = ...
for dataset in datasets:
    model.fit(dataset)
    gc.collect()

不幸的是,即使进行显式垃圾回收,内存(而非GPU内存)也会迅速耗尽。

  1. 数据集生成器。不幸的是,很难定义形状函数等。

非常感谢!

0 个答案:

没有答案