我想将张量流数据集拆分为训练和验证集以在估计器中使用它。为此,我必须提前创建数据集,然后将其传递给我的input_fn。
dataset = dataset.shuffle(10000)
train_dataset = dataset.take(train_lines).repeat()
valid_dataset = dataset.skip(train_lines).repeat()
def train_input_fn():
return train_dataset
但是,这会引发错误,因为数据集来自错误的图形:
Tensor("IteratorV2:0", shape=(), dtype=resource) must be from the same graph as Tensor("MapDataset_1:0", shape=(), dtype=variant).
Tensorflow显然需要在同一图中包含所有内容。如何重用数据集以保持随机分裂?