与负数据集分开识别积极性和消极性

时间:2017-06-26 21:29:05

标签: machine-learning dataset classification text-classification

首先,我希望您知道我是机器学习(ML)的新手。我正在开发一个项目来检测一组单词的正面或负面,因此我创建了一个包含可能的否定单词的数据库。因此ML可以发生并预测整个单词的正面或负面的整体得分。 我的问题是,是否可以在数据集中仅使用否定字词对正面字词进行分类?它是否会影响预测的准确性?

1 个答案:

答案 0 :(得分:0)

不,一般不可能。该模型无法区分(1)新的否定短语; (2)中性短语; (3)积极的短语。事实上,只有消极的短语,模型将很难学习“坏”和“坏”是对立的,因为它在负面文献中看到了很多“不”的引用,例如“不值得观看,即使是免费的。“