我想做一个面向任务的对话聊天机器人,用于预订餐厅,因为每个对话都有不同的顺序(例如,有些对话有5轮对话,即10句,而另一些对话有6轮对话,即12句。完全),我不知道如何批处理数据集。
如果我将所有数据集都转储到tf.data.Dataset.from_tensor_slices(my_datasets)中,它会告诉我“无法将非常规python序列转换为张量”。 我尝试了tf.ragged.constant,它也不起作用。因为它可以接收不同长度的句子,但不能接受不同形状的句子(不同的句子列表)。 如果我不能使用tensorflow张量,我只使用numpy数组,但是那没有利用tensorflow吗?
无论如何,我的代码很慢,很慢。