标签: machine-learning
我正在研究Multiclass文本分类。在此过程中,我们确定了14个月数据的23个标签(类别)。 在这12个月中,有10个月用于培训和安装模型。 在模型的前12个月中,数据使用test-train-split分为80-20 Train-test。
使用的SVM,随机森林,NB在所有情况下都具有70%的准确性。看起来不错。
但是,在预测第13和第14个月的数据(也需要手动分类)时,预测值甚至接近10%。
如何处理?