' h2o' package是一个有趣的ML java工具,可通过R访问.R包用于访问' h2o'被称为" h2o"。
其中一个输入途径是告诉' h2o' csv文件在哪里,让' h2o'上传原始CSV。只需指出文件夹并告诉“h2o”即可能更有效。进口"其中的一切"使用h2o.importFolder
命令。
有没有办法指出" gzip"的文件夹?或" bzip" csv文件并获取' h2o'导入它们?
根据此链接(here),h2o可以导入压缩文件。我只是没有看到为importFolder方法指定的方法。
导入压缩表单更快还是更慢?如果我有另一个输出程序,如果它们被压缩,它会节省我在h2o导入过程速度的时间吗?如果它们是原始文本?我们赞赏指南和性能最佳实践。
一如既往地征求意见,建议和反馈。
答案 0 :(得分:0)
我接受了@screechOwl的建议,并在0xdata.atlassian.net董事会上询问了h2o并给出了明确的答案:
它由用户"悬崖" 提供。
嗨,是的H2O - 导入文件夹时 - 获取文件夹中的所有文件;它会根据需要解压缩gzip或压缩文件,并将它们全部解析为一个大型CSV。所有文件都必须兼容CSV意义 - 相同数量和类型的列。
H2O目前不处理bzip文件。