标签: machine-learning svm random-forest logistic-regression naivebayes
编辑:
我有350000行和500个功能的分类数据集。这些特征是Tfidf矢量。 虽然我的Y(预测变量)具有1-16的值,但将句子分类为16种类型。
培训和测试是随机分开的
当我通过分类算法发送数据时,我的准确度差异很大:
SVM和Naive Bayes给出20%+(太少)
RandomForest提供大约55%的准确度,这似乎更准确,但仍然更少
我有没有理由在不同的算法中获得如此巨大的差异,是否有办法进一步提高准确度?
我试图通过他的推文预测一个人的性格