如何在Weka中以不同的概率截止值对多类数据进行分类

时间:2019-05-31 21:43:41

标签: class weka random-forest multiclass-classification machine-learning-model

Weka设置了默认的临界值(即50%)来区分其两类数据,并且可以通过在Weka界面中使用 SelectThreshold分类器轻松地对不同的临界值进行分类。现在在三类数据中,Weka选择最高概率,例如从0.333、0.421、0.246的概率中,Weka将选择0.421。但是在此类中,无法手动选择自定义截止值。有什么方法可以执行此任务,或者有什么方法可以帮助我理解多类数据中的自定义截止概念。

两个类别数据的示例

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.814  0.186
 2       1:+1       1:+1         *1      0    
 3       1:+1       1:+1         *0.58   0.42 
 4       1:+1       2:-1      +   0.294 *0.706
 5       1:+1       1:+1         *0.796  0.204
 6       1:+1       1:+1         *0.989  0.011
 7       1:+1       2:-1      +   0.294 *0.706
 8       1:+1       1:+1         *0.814  0.186

三个类别数据的示例

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.92   0.07   0.01 
 2       1:+1       1:+1         *0.97   0.03   0    
 3       1:+1        2:0      +   0.47  *0.52   0.01 
 4       1:+1       1:+1         *0.89   0.08   0.03 
 5       1:+1       1:+1         *0.643  0.338  0.02 
 6       1:+1        2:0      +   0.22  *0.73   0.05 
 7       1:+1       1:+1         *0.45   0.21   0.34 
 8       1:+1       3:-1      +   0.16   0.19  *0.65 

0 个答案:

没有答案