import sklearn.model_selection as model_selection
X_train,X_test,y_train,y_test=model_selection.train_test_split(X,y,
test_size=0.2,random_state = 200)
import sklearn.tree as tree
clf=tree.DecisionTreeClassifier(max_depth=3,random_state=200)
clf.fit(X_train,y_train)
clf.score(X_test,y_test)
import sklearn.metrics as metrics
metrics.roc_auc_score(y_test,clf.predict_proba(X_test)[:,1])
import pydotplus
os.environ["PATH"] += os.pathsep + 'C:/Program Files (x86)/Graphviz2.38/bin/'
os.chdir(data_dir)
我想知道代码的作用。
答案 0 :(得分:0)
metrics.roc_auc_score(y_test, clf.predict_proba()[:,1])
根据您的测试数据将被分类为1的预测概率计算出接收器工作特征曲线(ROC AUC)得分下的面积。
您可以在here中了解ROC AUC。
os.environ["PATH"] += os.pathsep + 'C:/Program Files ...'
将一个名为'C:/Program Files ...'
的新路径附加到环境路径中。请注意,os.pathsep
是分隔不同路径的字符。