如何将H2OFrame中的列转换为python列表?

时间:2017-04-03 16:05:12

标签: apache-spark spark-dataframe h2o

我已经阅读了H2O.ai和python API documentation的PythonBooklet.pdf,但仍然找不到干净的方法来做到这一点。我知道我可以做以下任何一种情况:

  • 将H2OFrame转换为Spark DataFrame并执行flatMap + collectcollect +列表理解。
  • 使用H2O' get_frame_data,它为我提供了一串由\n分隔的标题和数据;然后将它转换为一个列表(在我的情况下是一个数字列表)。

有更好的方法吗?谢谢。

2 个答案:

答案 0 :(得分:5)

您可以尝试这样的方法:通过调用.as_data_frame()将H2OFrame作为pandas数据帧引入python,然后在感兴趣的列上调用.tolist()。

一个自包含的例子w / iris

cordova plugin add https://github.com/apache/cordova-plugins.git#wkwebview-engine-localhost

答案 1 :(得分:0)

您可以(1)将H2o框架转换为pandas数据框架,以及(2)将pandas数据框架转换为list,如下所示:

pd=h2o.as_list(h2oFrame) 
l=pd["column"].tolist()