加快h2oframe上的操作

时间:2019-01-22 18:48:46

标签: python h2o

我正在读取一个非常稀疏的矩阵(300万x 10k)作为svmlight文件。

train_h2o = h2o.import_file('train.svml')

我想用1替换所有非零值,如下所示:

train_h2o = train_h2o!=0

问题:

  1. 是否有更有效的方法来执行此操作?这需要3分钟(而import_file在30秒内完成)。
  2. 通过运行h2o.frames(),我可以看到该数据帧现在有两个副本。有没有办法就地进行更改? this页上似乎显示了对列的就地操作。整个框架有可能相似吗?
  3. 此时强制评估的好方法是什么? h2o在以后的步骤中使用了惰性评估(根据需要)。

0 个答案:

没有答案