标签: python machine-learning svm text-classification
我有一个关于我必须对文本进行分类的项目的问题。在这个项目中,我有几千个问题(字符串),应该分为技术,体育,政治,历史,科学和地理。我的训练数据(已标记)是200个问题(我可以轻松扩展)。我尝试了使用NB分类器的TextBlob(使用NLTK),但这只给我带来了28%的准确率。目前,我正在寻找提高准确性的新可能性(k-NN,SVM,......)。
你有什么建议我应该用什么来分类这些问题吗?
真诚的,詹姆斯