h2o和镶木地板-无法确定文件类型错误

时间:2019-01-04 13:10:10

标签: python amazon-s3 parquet h2o

我们正在使用H2O(最新版本3.22.1.1)从s3中读取镶木地板数据。我们使用python与H2O对话。这是单个H2O实例-不是群集。

有时我们会收到此错误:

服务器错误water.exceptions.H2OIllegalArgumentException:   错误:无法确定文件类型。对于s3a://BUCKET_NAME/5c2e3fdc0c9c1800019c73f9/part-00001-c33635a2-76dc-4e49-948b-465726b7e3d9-c000.snappy.parquet

文件存在并且是有效的镶木地板文件。随后的导入工作正常。

这是将文件导入H2O的python代码

h2o.import_file(路径='s3a://BUCKET_NAME/5c2e3fdc0c9c1800019c73f9/part-00001-c33635a2-76dc-4e49-948b-465726b7e3d9-c000.snappy.parquet')

有什么方法可以迫使h2o使用镶木地板类型?

1 个答案:

答案 0 :(得分:0)

H20手册说要像df = h2o.import_file("/pathToFile/fileName")那样做  您需要to load data from the machine(s) running H2O to the machine running Python

因此,如果您的服务器未运行H20,则可能是它显示错误的原因。