我试着写这个
package org.apache.spark.h2o.utils
import water.fvec.{NewChunk, Frame, Chunk}
import water._
class Miss extends MRTask{
override def map(c: Chunk, nc: NewChunk): Unit = {
for (row <- 0 until c.len()) {
if( ){
nc.addNum(1)
}
else
nc.addNum(0)
}
}
}
我可以在if (...)
中检查该行中是否有null
值?
答案 0 :(得分:1)
H2O提供Chunk
API,专注于高效数据处理,内部仅使用原始Java类型。因此,没有null
检查,但您可以在给定行询问缺失值:
if (c.isNA(row)) { ... } else { ... }
或更短版本的示例:
nc.addNum(c.isNA(row) ? 1 : 0)