我遇到了一个问题,我想确保在解码和生成抽象风格的句子时生成特定的标记/单词。
我正在使用深度学习模型(如LSTM和转换器模型)来生成短句子(100-200个字符)。我希望在生成的文本中出现诸如地名或名词之类的单词(如品牌名称)。
我不确定对此是否有任何研究,经过大量搜索后我找不到真正的论文。
TIA,感谢任何潜在客户或建议。 :)
答案 0 :(得分:0)
我不确定,但是您可以尝试根据这些特定词来限制输出。您的培训师可以像seq2seq解码器一样,但是可以参加那些特定的单词,而不是去参加编码器的输出。