如何在文本数据和手工设计的数字特征上使用scikit样条线训练SVM?

时间:2018-07-16 08:58:33

标签: python machine-learning svm training-data

如何使用scikitlearn训练文本分类SVM模型?我想使用pipeline从训练数据的文本中提取count_vectorizertfidf特征,我想将一些数字化手工设计特征传递给模型我为每个训练样本计算的。

数据被装入以下格式的dataframe中: enter image description here

这是我现在拥有的:

model = Pipeline([('vectorizer', CountVectorizer(ngram_range=(1,2))),
                      ('tfidf', TfidfTransformer(use_idf=True)),
                      ('clf', OneVsRestClassifier(LinearSVC(class_weight="balanced")))])

model.fit(list(train_data.text), list(train_data.label))

0 个答案:

没有答案