我正在使用线性分类器来预测数据。下面是我的代码。如何提高预测的准确性?数据集包含约500k条目,其中350k在测试数据中。我在以下代码中看不到要更改的参数。我应该在CountVectorizer()中更改那些设置吗?我是python和NLP的新手,如果您能提供帮助,那就太好了!
from sklearn.svm import LinearSVC
model = LinearSVC()
start = time.time()
linear = model.fit( train_data_features, train['Level 1'] )