将压缩的csv导入' h2o'用r

时间:2015-02-07 17:16:38

标签: r csv import gzip h2o

' h2o' package是一个有趣的ML java工具,可通过R访问.R包用于访问' h2o'被称为" h2o"。

其中一个输入途径是告诉' h2o' csv文件在哪里,让' h2o'上传原始CSV。只需指出文件夹并告诉“h2o”即可能更有效。进口"其中的一切"使用h2o.importFolder命令。

有没有办法指出" gzip"的文件夹?或" bzip" csv文件并获取' h2o'导入它们?

根据此链接(here),h2o可以导入压缩文件。我只是没有看到为importFolder方法指定的方法。

导入压缩表单更快还是更慢?如果我有另一个输出程序,如果它们被压缩,它会节省我在h2o导入过程速度的时间吗?如果它们是原始文本?我们赞赏指南和性能最佳实践。

一如既往地征求意见,建议和反馈。

1 个答案:

答案 0 :(得分:0)

我接受了@screechOwl的建议,并在0xdata.atlassian.net董事会上询问了h2o并给出了明确的答案:

它由用户"悬崖" 提供。

嗨,是的H2O - 导入文件夹时 - 获取文件夹中的所有文件;它会根据需要解压缩gzip或压缩文件,并将它们全部解析为一个大型CSV。所有文件都必须兼容CSV意义 - 相同数量和类型的列。

H2O目前不处理bzip文件。