如何在SQL之上运行H2O.ai

时间:2016-03-18 09:24:10

标签: h2o

H2O.ai的人们在几张幻灯片和文件中提到H2O.ai可以在SQL之上运行。如何将H2O.ai实例连接到SQL Server?到目前为止,我能找到的唯一建议看起来相当令人失望:https://groups.google.com/forum/#!topic/h2ostream/x8BLSGbyvhA

是否有更优雅的方式直接连接到SQL Server?

1 个答案:

答案 0 :(得分:6)

H2O还没有原生JDBC连接器。

你可以利用Spark w / Sparkling Water中的H2O算法(https://github.com/h2oai/sparkling-water):使用Spark SQL将数据提取到RDD中,将其转换为H2OFrame(可以向任一方向转换),并传递给它到H2O的算法。

更直接的方法是将数据查询到CSV,然后H2O可以读取。如果您的数据量不是太大,这可能是合理的。