标签: text classification pytorch lstm word-embedding
我正在使用pytorch和单词嵌入进行文本分类
我正在尝试使用LSTM从预先训练的词嵌入数据中开发新闻类别分类器。
我的问题是
如果我训练了5000个语料库并用训练数据集中未包含的新词来预测一些新闻报道,我是否需要再次使用新词来训练数据?
如果我嵌入单词,是否需要保留此嵌入单词信息? (我称之为测试用词的是嵌入的)或有另一种方式来实现
还是有一种优雅的方法来实现它?
提前谢谢