应用错误收集

与负数据集分开识别积极性和消极性

时间：2017-06-26 21:29:05

标签： machine-learning dataset classification text-classification

首先，我希望您知道我是机器学习（ML）的新手。我正在开发一个项目来检测一组单词的正面或负面，因此我创建了一个包含可能的否定单词的数据库。因此ML可以发生并预测整个单词的正面或负面的整体得分。我的问题是，是否可以在数据集中仅使用否定字词对正面字词进行分类？它是否会影响预测的准确性？

1 个答案:

答案 0 :(得分：0)

不，一般不可能。该模型无法区分（1）新的否定短语; （2）中性短语; （3）积极的短语。事实上，只有消极的短语，模型将很难学习“坏”和“坏”是对立的，因为它在负面文献中看到了很多“不”的引用，例如“不值得观看，即使是免费的。“