data_train是一组文档,我已经使用此数据集训练了我的randomforestclassifier。
X_train = vectorizer.fit_transform(data_train)
feature_names = vectorizer.get_feature_names()
clf=RandomForestClassifier(n_estimators=1000)
clf.fit(X_train, y_train)
vectorizer.fit_transform将data_train中的文档转换为矢量形式。 X_train进一步用于构建森林。 现在我想在此分类器中检查我的单个文档“ data_test”。怎么做? 我尝试过
X_test = vectorizer.transform(data_test)
pred = clf.predict(X_test)
它给出错误“ ValueError:可迭代原始文本文档,接收字符串对象。”
Blockquote