混淆我的检查空值代码的结果

时间:2015-10-28 19:14:15

标签: scala h2o

我试过这个来检查行是否为空。



package org.apache.spark.h2o.utils

import water.fvec.{NewChunk, Frame, Chunk}
import water._

class Miss extends MRTask {
  override def map(c: Chunk, nc: NewChunk): Unit = {
    for (row <- 0 until c.len()) {
      if(c.atd(row) == 0){  
       nc.addNum(0)
      }
      else
       nc.addNum(1)
    }
  }
}
&#13;
&#13;
&#13;

我无法理解我的代码的结果

&#13;
&#13;
           A    B    C    D            E   check
    min                                     0
   mean                                     0
 stddev                                     0
    max                                     1
missing                                     0
      0  5.1  3.5  1.4  0.2  Iris-setosa    1
      1  4.9    3  1.4  0.2  Iris-setosa    1
      2  4.7  3.2  1.3  0.2  Iris-setosa    1
      3  4.6  3.1  1.5  0.2  Iris-setosa    1
      4    5  3.6  1.4  0.2  Iris-setosa    1
      5  5.4  3.9  1.7  0.4  Iris-setosa    1
      6  4.6  3.4  1.4  0.3  Iris-setosa    1
      7    5  3.4  1.5  0.2  Iris-setosa    1
      8  4.4  2.9  1.4  0.2  Iris-setosa    1
      9  4.9  3.1  1.5  0.1  Iris-setos...
&#13;
&#13;
&#13;

在代码生成检查列中,为什么我的最大行为1?我是h2oFrame的新手,任何人都可以帮我理解这个吗?我的代码有问题吗? THX

1 个答案:

答案 0 :(得分:1)

您要追加一个仅包含0,1值的新列。 因此,存储在列中的最小值为0.列中存储的最大值为1.在这种情况下,均值== 0是可疑的,这可能是一个错误。