在Scala中截断数据框列值

时间:2017-05-11 11:33:04

标签: scala dataframe spark-dataframe

df是数据框,

df.select($" createdon")。show

输出是:

|           createdon|
+--------------------+
|2017-05-11 15:29:...|
|2017-05-11 15:29:...|
|2017-05-11 11:02:...|
|2017-05-11 11:02:...|
|2017-05-11 15:29:...|

我需要createdon值只是日期而不是整个时间戳。如何将包含createdon值的新数据框只作为日期而不是整个时间戳?

2 个答案:

答案 0 :(得分:1)

to_date函数应该这样做:

df.withColumn("createdon", to_date($"createdon")).show
+----------+
| createdon|
+----------+
|2017-05-11|
+----------+

答案 1 :(得分:0)

您可以使用地图转换(假设所选值属于String类型)

df.select($"createdon").map(_.getAs[String]("createdon").substring(0, 11)).show()