我想将spark DataFrame转换为h2o RowData格式。
我的数据框如下:
+---+---+---+
| a| b| c|
+---+---+---+
| 1| 2| 3|
+---+---+---+
我想将其转换为以下等效格式-但要使用rdd操作来利用并行性。 Python可能吗?
RowData = spark._jvm.hex.genmodel.easy.Rowdata
r=RowData()
r.put("a",1)
r.put("b",2)
r.put("c",3)