应用错误收集

火炬文本数据build_vocab / data_field

时间：2019-09-14 06:23:30

标签： pytorch torchtext

我想问你一些有关Torchtext的问题。

我有一个有关抽象文本摘要的任务，并使用pytorch构建了seq2seq模型。

我只是想知道在torchtext中由build_vocab函数构造的data_field。

在机器翻译中，我接受需要两个data_fields（输入，输出）。

但是，概括来说，输入数据和输出数据是同一语言。

在这里，我应该在这里输入两个data_field（full_sentence，abstract_sentence）吗？

还是只使用一个data_field可以吗？

恐怕我的错误选择会使模型的性能下降。

请给我一个提示。

1 个答案:

答案 0 :(得分：0)

在汇总和其他任务方面您是正确的，构建并使用相同的词汇来进行输入和输出是很有意义的