应用错误收集

我在数据框中保存了文本评论（即电影）-df_reviews：包含评论ID和文本评论。另外，我有一个Python字典，其中包含1000个意见语（例如{'good'：1，'bad'：-1，....}），其极性为（-1/1负/正）。我需要将这两个（行上的评论数据框和列上的意见词）组合成一个向量数据集，以便随后训练逻辑回归模型。如果电影评论中包含意见词，则行/列相交值将为True，否则为False。任何人都可以提供此类矢量化示例的帮助吗？一种想法是dict2vec，但到目前为止尚未使用。

将数据框和字典合并为向量

0 个答案: