火炬文本数据build_vocab / data_field

时间:2019-09-14 06:23:30

标签: pytorch torchtext

我想问你一些有关Torchtext的问题。

我有一个有关抽象文本摘要的任务,并使用pytorch构建了seq2seq模型。

我只是想知道在torchtext中由bu​​ild_vocab函数构造的data_field。

在机器翻译中,我接受需要两个data_fields(输入,输出)。

但是,概括来说,输入数据和输出数据是同一语言。

在这里,我应该在这里输入两个data_field(full_sentence,abstract_sentence)吗?

还是只使用一个data_field可以吗?

恐怕我的错误选择会使模型的性能下降。

请给我一个提示。

1 个答案:

答案 0 :(得分:0)

在汇总和其他任务方面您是正确的,构建并使用相同的词汇来进行输入和输出是很有意义的