使用句子:
scala> val intento2 = sql("SELECT _CreationDate FROM tablaTemporal" )
intento2: org.apache.spark.sql.DataFrame = [_CreationDate: string]
scala> intento2.show(5, false)
我收到了这个输出:
+-----------------------+
|_CreationDate |
+-----------------------+
|2008-07-31T00:00:00.000|
|2008-07-31T14:22:31.287|
|2008-07-31T14:22:31.287|
|2008-07-31T14:22:31.287|
|2008-07-31T14:22:31.317|
+-----------------------+
only showing top 5 rows
但我需要的结果是相同的,但没有scala / spark添加的符号:
2005-07-31T14:20:19.239
2007-07-31T14:20:31.287
2009-07-31T14:21:33.287
2005-07-31T14:23:36.287
2009-07-31T14:20:38.317
如何打印如上所述的干净输出?
答案 0 :(得分:1)
在这里,您正在打印数据框。
您要做的是打印数据框的每条记录:
intento2.collect().map(_.getString(0)).foreach(println)
collect将数据帧转换为Row对象数组。
然后我们用row.getString(0)将每一行映射到它的第一个元素。事实上,Row只包含一个元素,即日期。