我正在进行方言文本分类,它给我提供了分类错误的标签。我在scikit learning中使用MultinomialNB()
和CountVectorizer()
的朴素贝叶斯。数据很大,我需要知道哪里出了问题。
是否有某种错误分析工具可以帮助我改善模型?我进行了搜索,发现了一个名为SIDE的工具,但链接已断开。
此外,处理朴素贝叶斯分类器的参数是否对改善模型有帮助?我还没有完全探讨我可以在MultinomialNB()
中添加的内容。我把它留空。与CountVectorizer()
相同,我在括号内没有放置任何内容。
因为在开始指责数据之前,我需要排除所有可能性。除了清理数据或训练新数据外,您认为我还应该尝试改进模型吗?