Question

我想从scikit-learn中使用过的数据here估计模型。我正在使用DecisionTreeClassifier.score函数，但是在运行代码时，我将收到ValueError：

不能同时处理连续类和多类。

这是我使用的代码：

from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
nba = pd.read_excel(r"C:\Users\user\Desktop\nba.xlsx")
X = nba.drop('平均得分', axis = 1)
y = nba['平均得分']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size = 0.20)
nba_tree = DecisionTreeClassifier()
nba_tree.fit(X_train, y_train.astype('int'))
y_pred = nba_tree.predict(X_test)
nba_tree.score(X_test, y_test)

Answer 1

您的目标变量平均得分似乎是一个连续变量。可能您正在尝试解决回归问题。如果是这种情况，请尝试使用DecisionTreeRegressor而不是DecisionTreeClassifier。

ValueError：无法处理连续类和多类的混合情况

1 个答案: