ValueError:无法处理连续类和多类的混合情况

时间:2018-12-22 11:22:57

标签: python machine-learning scikit-learn decision-tree

我想从scikit-learn中使用过的数据here估计模型。我正在使用DecisionTreeClassifier.score函数,但是在运行代码时,我将收到ValueError:

  

不能同时处理连续类和多类。

这是我使用的代码:

from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
nba = pd.read_excel(r"C:\Users\user\Desktop\nba.xlsx")
X = nba.drop('平均得分', axis = 1)
y = nba['平均得分']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size = 0.20)
nba_tree = DecisionTreeClassifier()
nba_tree.fit(X_train, y_train.astype('int'))
y_pred = nba_tree.predict(X_test)
nba_tree.score(X_test, y_test)

1 个答案:

答案 0 :(得分:0)

您的目标变量平均得分似乎是一个连续变量。可能您正在尝试解决回归问题。如果是这种情况,请尝试使用DecisionTreeRegressor而不是DecisionTreeClassifier。