我想利用word2vec预训练向量来分类段落。我可以从中提取任何众所周知的好功能吗?我已经读过,对段落中所有单词的向量求平均值非常有用。在这里:https://github.com/Poyuli/sentiment.analysis
是否有任何地方我可以找到一个很好的一般性讨论,以充分利用谷歌提供的预训练word2vec向量?
答案 0 :(得分:0)
“平均”是文本分类的有效方式
我建议你尝试 stanford GloVe 工具,它可以完成与word2vec相同的工作。
它拥有自己预先训练过的单词向量。您可以查看此网站http://nlp.stanford.edu/projects/glove/