决策树分类器有问题

时间:2019-10-15 09:59:04

标签: scikit-learn decision-tree

import sklearn.model_selection as model_selection
X_train,X_test,y_train,y_test=model_selection.train_test_split(X,y,
                                       test_size=0.2,random_state = 200)

import sklearn.tree as tree
clf=tree.DecisionTreeClassifier(max_depth=3,random_state=200)
clf.fit(X_train,y_train)
clf.score(X_test,y_test)

import sklearn.metrics as metrics
metrics.roc_auc_score(y_test,clf.predict_proba(X_test)[:,1])

import pydotplus
os.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/'
os.chdir(data_dir)

我想知道代码的作用。

  1. metrics.roc_auc_score(y_test,clf.predict_proba(X_test)[:, 1])
  2. os.environ [“ PATH”] + = os.pathsep +'C:/程序文件(x86)/Graphviz2.38/bin /'

1 个答案:

答案 0 :(得分:0)

metrics.roc_auc_score(y_test, clf.predict_proba()[:,1])根据您的测试数据将被分类为1的预测概率计算出接收器工作特征曲线(ROC AUC)得分下的面积。

您可以在here中了解ROC AUC。

os.environ["PATH"] += os.pathsep + 'C:/Program Files ...'将一个名为'C:/Program Files ...'的新路径附加到环境路径中。请注意,os.pathsep是分隔不同路径的字符。