Spark中的array <string>和Array <string>有什么区别?

时间:2017-05-24 03:07:18

标签: sql scala apache-spark

我使用此代码来加强分组数据:

val result=union_df.orderBy(desc("timestamp")).groupBy("id").agg(collect_set("region") as "region")

然后我得到了数据类型:

org.apache.spark.sql.DataFrame = [id: string, region: array<string>]

array<string>Array<String>之间的区别是什么?如何在map函数中迭代array<string>(Row没有getArray函数?)

1 个答案:

答案 0 :(得分:2)

getSeq()函数返回数组,或者您可以getAsgetAs[Array[String]]()使用getAs[Seq[String]]()方法

array<string>scala.collection.mutable.WrappedArray[String]],与Array<String>相同,并且在Row内使用了包装器。