使用pytorch和词嵌入的新闻类别分类器

时间:2019-12-10 14:10:19

标签: text classification pytorch lstm word-embedding

我正在使用pytorch和单词嵌入进行文本分类

我正在尝试使用LSTM从预先训练的词嵌入数据中开发新闻类别分类器。

我的问题是

  1. 如果我训练了5000个语料库并用训练数据集中未包含的新词来预测一些新闻报道,我是否需要再次使用新词来训练数据?

  2. 如果我嵌入单词,是否需要保留此嵌入单词信息? (我称之为测试用词的是嵌入的)或有另一种方式来实现

还是有一种优雅的方法来实现它?

提前谢谢

0 个答案:

没有答案