我想问你一些有关Torchtext的问题。
我有一个有关抽象文本摘要的任务,并使用pytorch构建了seq2seq模型。
我只是想知道在torchtext中由build_vocab函数构造的data_field。
在机器翻译中,我接受需要两个data_fields(输入,输出)。
但是,概括来说,输入数据和输出数据是同一语言。
在这里,我应该在这里输入两个data_field(full_sentence,abstract_sentence)吗?
还是只使用一个data_field可以吗?
恐怕我的错误选择会使模型的性能下降。
请给我一个提示。
答案 0 :(得分:0)
在汇总和其他任务方面您是正确的,构建并使用相同的词汇来进行输入和输出是很有意义的