如何将PySpark RDD转换为H2O RowData

时间:2019-03-20 00:49:18

标签: dataframe rdd h2o

我想将spark DataFrame转换为h2o RowData格式。

我的数据框如下:

+---+---+---+
|  a|  b|  c|
+---+---+---+
|  1|  2|  3|
+---+---+---+

我想将其转换为以下等效格式-但要使用rdd操作来利用并行性。 Python可能吗?

RowData = spark._jvm.hex.genmodel.easy.Rowdata
r=RowData()
r.put("a",1)
r.put("b",2)
r.put("c",3)

0 个答案:

没有答案