我需要使用Apache java spark将类型为String
的数据集转换为Row
类型的数据集:
Dataset<String> dataDs = spark.createDataset(dataList,Encoders.STRING());
dataDs
需要转换为Row
类型。
答案 0 :(得分:2)
DataSet[Row]
在Spark中称为DataFrame
。您可以使用spark.createDataset
。
spark.createDataFrame
方法
也可以使用toDF
函数将数据集转换为数据框。
DataFrame df = dataDs.toDF()