我想使用来自GLOVE的预训练向量在我的神经网络中将单词嵌入用于嵌入层。构造word2index字典时,是否需要将词汇限制在训练集中? 那会不会导致有限的不可泛化模型? 是否考虑将GLOVE的所有词汇都推荐使用?
答案 0 :(得分:1)
是的,最好限制您的唱头大小。因为预训练的嵌入(例如GLOVE)中包含很多单词,这些单词不是很有用(因此Word2Vec),而字长越大,则需要的RAM越多。其他问题。
从所有数据中选择令牌。如果您的数据足够大,则不会导致受限的不可泛化模型。如果您认为您的数据没有足够的令牌,那么您应该知道两件事:
我有一个答案,说明如何从预先训练的模型in here中选择次要的词向量