Spark Java - 如何在数据框Dataset <row>中迭代行,并将一列的值添加到Arraylist

时间:2018-04-02 09:04:54

标签: java apache-spark spark-dataframe apache-spark-mllib

我在Dataset<Row>中有一个3 columns包含Java。我想迭代它的行,然后将此列的值添加到ArrayList。有谁可以帮助我?

请考虑我在Java工作。

谢谢。

2 个答案:

答案 0 :(得分:2)

谢谢Ernest Kiwele。

它以这种方式运作:

List<Row> arrayList= new ArrayList<>();
arrayList=dataset.collectAsList();

答案 1 :(得分:0)

你也可以使用 dataset.forEach( row -> syso(row));