我很长一段时间以来一直在研究文本分类问题,而且我在解释结果和下一步的问题时遇到了问题。
我一直致力于发布推文,如果他们是暴力的话就会进行分类。
结果
对于大小为1763的数据集(pos:214,neg:1549),训练为1234(pos:152,neg:1082)和TEST set 529(pos:62,neg:469)
具有BOW功能的测试集上的AUC分数 SVM:0.69 LR:0.67 1层NN:0.69
我无法解释问题是在拥有,数据还是更改模型。我认为,由于不同的模型给出了类似的结果,这意味着我需要更多质量更好的数据和更积极的例子。
我也不知道接下来应该做什么。
谢谢,
答案 0 :(得分:0)
如果您在解释结果时遇到问题,可以尝试使用不同的指标来评估分类的质量。例如,您可以尝试准确性,精确度,召回率和f1分数。在解释结果并确定您希望关注的指标之后,您可以探索不同的策略来改进它 - 例如,添加更多数据,执行超参数调整和/或尝试不同的模型。本书章节讨论了文本分类评估,可能对您有所帮助:Evaluation of text classification。感谢