我的tf.dataset是数据集生成器。使用它与tf.keras预报()进行预测,我得到的输出是原始输入的几倍。
我只是使用形式的生成器
def gen():
for ex in features:
d = {k: v for k, v in asdict(ex).items() if v is not None}
label = d.pop("label")
yield (d, label)
input_names = ["input_ids"] + tokenizer.model_input_names
dataset=tf.data.Dataset.from_generator(
gen,
({k: tf.int32 for k in input_names}, tf.int64),
({k: tf.TensorShape([None]) for k in input_names}, tf.TensorShape([])),)
没有重复或其他任何内容。
此生成器实际输出什么来进行预测?如何控制尺寸。为什么输出的内容大于字典的原始大小?
如何正确使用生成器进行预测?