这行代码打印出我想要的一列。但我想并排打印所有列的不同值。
testDF.select('col_name).distinct().show
+--------+
|col_name|
+--------+
| null|
| No|
| Yes|
+--------+
我想弄清楚的一部分是如何确定在这种情况下使用哪种Scala类型?
val c1 = testDF.select('col_name).distinct()
c1: org.apache.spark.sql.Dataset[org.apache.spark.sql.Row] = [col_name: string]
如何将多个Row类型合并为列,这些列仅显示它们在一个表中引用的列的不同值(单个Spark DataFrame)?