Python,从消费者评论中提取关键方面

时间:2017-09-14 03:57:32

标签: python text nltk

我有一份消费者评论数据集。从这些评论中,我想提取最常见的方面。我申请的流程包括
- 步骤1:将评论标记为句子
- 步骤2:在基本NLP预处理之后将句子标记为单词。预处理删除标点符号和英语停用词。
- 步骤3:Pos_tagging并提取pos标签为'NN','NNP','NNS','NNPS'的所有单词
- 步骤4:在所有评论中组合所有单词以找到最常出现的单词
- 步骤5:使用前40个术语作为我的方面

这是一个好方法还是你建议做一些不同的事情?

1 个答案:

答案 0 :(得分:0)

是..但是您需要通过选择产品最基本的规范来自己指定方面