如何使用CNN从imdb数据集创建word2vector模型并获取其特征图

时间:2019-02-12 09:55:59

标签: python nltk word2vec sentiment-analysis

我是python的新手,我需要完成有关IMDB评论情感分析的项目。我并没有默默地了解如何将imdb数据集aclImdb_v1.tar训练为模型。请告诉我如何从该数据集中训练模型。

下面是我需要为我的项目实现的方法。

文本评论->嵌入式层->单词矢量生成-> CNN->特征图-> LSTM->分类层

我期望的结果是查找作为输入的评论是正面还是负面。 请帮助我,请宽恕我无知的单词。

1 个答案:

答案 0 :(得分:0)

如果数据集的大小很大,则可以轻松地使用深度学习来完成项目。 首先,您需要创建一个管道以将数据转换为可表示的形式,然后输入模型。

如果您使用TensorFlow编写,也不必担心计算成本,Google Cloud TPU在Google Colab上提供免费服务。