我有一个数据框架,其中注释和情感作为列。 我已经生成了word2Vec的评论表示,如下所示: 来自手套进口语料库,手套
import moment from 'moment';
corpus = Corpus()
corpus.fit(data['Comments'].apply(lambda x : x.split()), window=10)
输出:
glove = Glove(no_components=5, learning_rate=0.05)
glove.fit(corpus.matrix, epochs=30, no_threads=4, verbose=True)
glove.word_vectors[glove.dictionary['drug']]
现在,我想使用此word2vec输出并训练array([ 0.9242366 , -0.81431099, -0.6752495 , 0.67732151, 0.52884703])
或多项式分类算法。
如果您的建议包括python的Pipeline用法,那将更好。
任何想法/代码段或教程都将有所帮助。
谢谢。