我使用此代码来加强分组数据:
val result=union_df.orderBy(desc("timestamp")).groupBy("id").agg(collect_set("region") as "region")
然后我得到了数据类型:
org.apache.spark.sql.DataFrame = [id: string, region: array<string>]
array<string>
和Array<String>
之间的区别是什么?如何在map函数中迭代array<string>
(Row没有getArray
函数?)
答案 0 :(得分:2)
有getSeq()
函数返回数组,或者您可以getAs
或getAs[Array[String]]()
使用getAs[Seq[String]]()
方法
array<string>
是scala.collection.mutable.WrappedArray[String]]
,与Array<String>
相同,并且在Row
内使用了包装器。