我是H2o ai的新手,并且我已经尝试使用python API做一些事情。对我来说看起来不错。我知道火花,而且我对苏打水非常感兴趣。所以我的问题是-在pySparkling中,我可以使用适用于H2o ai ptatfom的相同python API吗?
答案 0 :(得分:0)
是的。
根据我发现的pySparkling文档:
PySparkling是Python与Sparkling Water的集成。它允许用户从Python API在Spark集群上启动H2O服务。
在PySparkling驱动程序中,使用Py4J启动驱动程序JVM和Java Spark Context的Spark Context用于创建H2O Context(hc)。这继而在Spark生态系统中启动了H2O云(集群)。 启动H2O集群后,将使用H2O Python软件包与之交互并运行H2O算法。所有纯H2O调用均通过H2O的REST API接口执行。用户可以使用PySparkling将常规的PySpark工作流程与H2O算法轻松集成。