将数据框和字典合并为向量

时间:2019-01-23 17:21:12

标签: python dictionary dataframe vectorization

我在数据框中保存了文本评论(即电影)-df_reviews:包含评论ID和文本评论。另外,我有一个Python字典,其中包含1000个意见语(例如{'good':1,'bad':-1,....}),其极性为(-1/1负/正)。 我需要将这两个(行上的评论数据框和列上的意见词)组合成一个向量数据集,以便随后训练逻辑回归模型。如果电影评论中包含意见词,则行/列相交值将为True,否则为False。 任何人都可以提供此类矢量化示例的帮助吗?一种想法是dict2vec,但到目前为止尚未使用。

0 个答案:

没有答案