应用错误收集

我在youtube上浏览了sentdex nltk教程并稍微修改了他的代码以构建文本分类器或负面和正面评论。我正在使用一组正面和负面评论，然后基于构建分类器的5000个最常见的单词。

我的问题：鉴于我目前的代码使用的是我正在使用的分类器，我怎样才能提高结果的准确性？

非常感谢任何帮助，谢谢。我希望这个问题符合stackoverflow标准，如果它没有请在下面评论，我会尝试编辑问题