我有一个包含100条记录的数据集,我使用数据集运行了决策树。
On println(model.toDebugString)
输出是:
DecisionTreeModel classifier of depth 3 with 7 nodes
If (feature 0 <= 2.0)
Predict: 0.0
Else (feature 0 > 2.0)
If (feature 1 <= 12354.0)
If (feature 2 <= 14544.0)
Predict: 1.0
Else (feature 2 > 14544.0)
Predict: 0.0
Else (feature 1 > 12354.0)
Predict: 1.0
是否可以知道有多少行没有进入If条件和Else条件?
如40行在If(特征0 <= 2.0)中,60行在Else中 (特征0> 2.0)
答案 0 :(得分:1)
不幸的是,现在没有神奇的方法来计算它。你需要循环你的条件并过滤然后计数。
示例:df.filter([condition1]).count