Apache Spark Decision Tree

时间:2016-02-02 12:48:52

标签: scala apache-spark apache-spark-mllib

我有一个包含100条记录的数据集,我使用数据集运行了决策树。

On println(model.toDebugString)

输出是:

DecisionTreeModel classifier of depth 3 with 7 nodes
  If (feature 0 <= 2.0)
   Predict: 0.0
  Else (feature 0 > 2.0)
   If (feature 1 <= 12354.0)
    If (feature 2 <= 14544.0)
     Predict: 1.0
    Else (feature 2 > 14544.0)
     Predict: 0.0
   Else (feature 1 > 12354.0)
    Predict: 1.0

是否可以知道有多少行没有进入If条件和Else条件?

  

如40行在If(特征0 <= 2.0)中,60行在Else中   (特征0> 2.0)

1 个答案:

答案 0 :(得分:1)

不幸的是,现在没有神奇的方法来计算它。你需要循环你的条件并过滤然后计数。

示例:df.filter([condition1]).count