使用apache OpenNLP进行自然语言处理

时间:2017-06-28 08:16:31

标签: nlp

如何在自然语言处理中找到%的数据准确度?

试图找到电影评论数据的准确性

一旦新的电影评论到来,为了确定评论是否积极,请按照以下步骤进行处理

用于培训目的的电影评论文件,大小为400 MB,有200 K +评论评论及其相应评级。

根据文件中的评级实现了一揽子单词的方法 例如:如果评级> 5然后把它放进好的包里,然后把坏包放进去。

虽然实施NLP技术下面使用的词袋方法

  1. 标记化
  2. 停止删除字词
  3. 词干
  4. 特殊字符删除等
  5. 一旦袋子准备就绪,使用上面提到的NLP技术进行新的评论评论,然后查看袋子计算好的和坏的袋子的平均值,取决于决定新的评论是否为正的。“ p>

    请建议如何计算%的准确度?

1 个答案:

答案 0 :(得分:0)

将您的数据拆分为train ans test set。然后,您可以评估(计算在您的测试中训练集训练模型的模型的准确度)。为了获得更可靠的结果,您可以以交叉折叠评估方式评估您的方法。