Question

例如，我的数据带有多个标签

我的 X 设置是从第二列到第三列，我想对第一列或最后列，所以我将 Y 列为最后一列。

目标是，如果我对Vios进行分类，它将返回我 Car 或 0 ，换句话说，它可以找到第一行< / strong>。

分类用例：

classify("poodle") #just pretend this is a working function

返回：宠物

我是如何做到的以训练我的模型：

from sklearn.feature_extraction.text import TfidfVectorizer X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 72) count_vect = CountVectorizer() X_train_counts = count_vect.fit_transform(X_train) tfidf_transformer = TfidfTransformer() X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts) clf3 = RandomForestClassifier().fit(X_train_tfidf, y_train)

我正在网上使用某个地方的指南，该指南的工作原理与之完全相同，但最终我得到了回报：

ValueError: Found input variables with inconsistent numbers of samples: [5, 4156]

我立即知道自己做错了。我如何训练模型以实现我的目标？我应该遵循this的相关指导或技巧吗？

决策树分类器可根据其他列的值对值进行分类

0 个答案: