决策树分类器可根据其他列的值对值进行分类

时间:2019-12-18 22:41:35

标签: python machine-learning classification

例如,我的数据带有多个标签

enter image description here

我的 X 设置是从第二列到第三列,我想对第一列或最后列,所以我将 Y 列为最后一列。

目标是,如果我对Vios进行分类,它将返回我 Car 0 ,换句话说,它可以找到第一行< / strong>。

分类用例:

classify("poodle") #just pretend this is a working function

返回:宠物

我是如何做到的以训练我的模型:

from sklearn.feature_extraction.text import TfidfVectorizer
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 72)
count_vect = CountVectorizer()
X_train_counts = count_vect.fit_transform(X_train)
tfidf_transformer = TfidfTransformer()
X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)
clf3 = RandomForestClassifier().fit(X_train_tfidf, y_train)

我正在网上使用某个地方的指南,该指南的工作原理与之完全相同,但最终我得到了回报:

ValueError: Found input variables with inconsistent numbers of samples: [5, 4156]

我立即知道自己做错了。我如何训练模型以实现我的目标?我应该遵循this的相关指导或技巧吗?

0 个答案:

没有答案