如何使用scala从dataframe获取字符串列的最大长度?

时间:2016-12-21 19:09:30

标签: scala apache-spark max spark-dataframe

这可能是一个非常简单的问题。我正在使用带有scala的Spark 1.6

var DF=hivecontext.sql("select name from myTable")
val name_max_len =DF.agg(max(length($"name"))) // did not work

println(name_max_len)

如何获得最大长度?

感谢
侯塞因

1 个答案:

答案 0 :(得分:10)

你应该收集结果:

val df = Seq("foo", "bar", "foobar").toDF("name")
df.agg(max(length($"name"))).as[Int].first