如何在自然语言处理中找到%的数据准确度?
试图找到电影评论数据的准确性
一旦新的电影评论到来,为了确定评论是否积极,请按照以下步骤进行处理
用于培训目的的电影评论文件,大小为400 MB,有200 K +评论评论及其相应评级。
根据文件中的评级实现了一揽子单词的方法 例如:如果评级> 5然后把它放进好的包里,然后把坏包放进去。
虽然实施NLP技术下面使用的词袋方法
一旦袋子准备就绪,使用上面提到的NLP技术进行新的评论评论,然后查看袋子计算好的和坏的袋子的平均值,取决于决定新的评论是否为正的。“ p>
请建议如何计算%的准确度?
答案 0 :(得分:0)
将您的数据拆分为train ans test set。然后,您可以评估(计算在您的测试中训练集训练模型的模型的准确度)。为了获得更可靠的结果,您可以以交叉折叠评估方式评估您的方法。