我正致力于使用LSTM进行情绪分析, 我有一个csv格式的数据集,带有['Sentiment','Tweet']。 Wor2vec模型是在这个数据集上训练的,但现在我不知道如何将其作为输入提供给lstm。我试过用向量替换csv文件中的单词,但我不能这样做。 在构建lstm或者时,是否需要使用任何查找方法 我们必须用向量替换csv文件中的单词,但是怎么做呢?
(我保存了我训练过的word2vec模型)
答案 0 :(得分:0)
您使用的是哪个库?无论如何,是的,您必须将每个输入单元(每个数据点)映射到单词ID。例如,如果以下是您要提供给模型的单条推文:
狐狸跳过棕色的狗这将通过字典转换为完全由单词ID组成的输入(根据LSTM的设计方式进行一些填充)
23 69 10 4 254 145
这些数字可以存储在一个numpy数组中,例如,在您将它们提供给网络之前,并将情绪(比如说0.54)作为预期输出。