为什么GPT在微调时添加[CLS]令牌?

时间:2019-10-01 07:52:50

标签: nlp pre-trained-model

我知道 CLS 标记的隐藏状态可以看作是整个句子的表示。 为什么不直接使用最后一个单词的隐藏状态?

谢谢!

0 个答案:

没有答案