如何对文本数据执行回归算法(IMDB评论)?

时间:2019-01-27 07:52:00

标签: python-3.x linear-regression

                 reviews              label
0   i admit the great majority of...    1
1   take a low budget inexperienced ... 0
2   everybody has seen back to th...    1
3   doris day was an icon of b...       0
4   after a series of silly fun ...     0

我有一个电影评论和标签列的数据框(1-正面,0负面评论)

我还有另一个相似的测试数据集,只包含评论栏

我需要使用线性回归建立情感分析模型以预测测试数据框的标签列

所需输出:带有标签列的测试数据框

对数字数据进行回归,如何将文本审阅转换为数字形式以适应它?

1 个答案:

答案 0 :(得分:0)

您需要将单词转换为向量,这是一种称为word2vec的技术。这是一个说明technic

的链接