Spark Scala - 显示一个表中所有列的不同值

时间:2017-07-18 21:11:12

标签: scala apache-spark types distinct-values

这行代码打印出我想要的一列。但我想并排打印所有列的不同值。

testDF.select('col_name).distinct().show

+--------+
|col_name|
+--------+
|    null|
|      No|
|     Yes|
+--------+

我想弄清楚的一部分是如何确定在这种情况下使用哪种Scala类型?

val c1 = testDF.select('col_name).distinct()
c1: org.apache.spark.sql.Dataset[org.apache.spark.sql.Row] = [col_name: string]

如何将多个Row类型合并为列,这些列仅显示它们在一个表中引用的列的不同值(单个Spark DataFrame)?

0 个答案:

没有答案