我在youtube上浏览了sentdex nltk教程并稍微修改了他的代码以构建文本分类器或负面和正面评论。 我正在使用一组正面和负面评论,然后基于构建分类器的5000个最常见的单词。
我的问题:鉴于我目前的代码使用的是我正在使用的分类器,我怎样才能提高结果的准确性?
https://gist.github.com/egimple/08e8737140cc93604ef2541d803e8987
非常感谢任何帮助,谢谢。 我希望这个问题符合stackoverflow标准,如果它没有请在下面评论,我会尝试编辑问题