我想从scikit-learn中使用过的数据here估计模型。我正在使用DecisionTreeClassifier.score
函数,但是在运行代码时,我将收到ValueError:
不能同时处理连续类和多类。
这是我使用的代码:
from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
nba = pd.read_excel(r"C:\Users\user\Desktop\nba.xlsx")
X = nba.drop('平均得分', axis = 1)
y = nba['平均得分']
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size = 0.20)
nba_tree = DecisionTreeClassifier()
nba_tree.fit(X_train, y_train.astype('int'))
y_pred = nba_tree.predict(X_test)
nba_tree.score(X_test, y_test)
答案 0 :(得分:0)
您的目标变量平均得分
似乎是一个连续变量。可能您正在尝试解决回归问题。如果是这种情况,请尝试使用DecisionTreeRegressor而不是DecisionTreeClassifier。