我正在编写一个Python程序,以简单的英语将菜单项的注释分类为肯定,否定和中性。我没有训练数据集。 我已经清理了python中的数据,可以对其进行分类了。我一直在尝试各种分类器,例如NB等,但是由于我没有该模型的训练数据集,因此它们无法工作。
有人可以帮助我采用哪种方法对测试数据集进行分类??
我尝试将nltk和sklearn与Multinomial NB,单词袋和tfidf一起使用。
我希望每个评论/评论的结果显示为“ -1”表示否定,“ 0”表示中立,“ + 1”表示肯定。如果我可以在-0.7,-0.6,.. + 0.3,+ 0.6等方面实现更大的输出粒度,那也很好。