我此DataFrame org.apache.spark.sql.DataFrame
:
|-- timestamp: integer (nullable = true)
|-- checkIn: string (nullable = true)
| timestamp| checkIn|
+----------+----------+
|1521710892|2018-05-19|
|1521710892|2018-05-19|
期望的结果:获取一个新列,其中包含日期checkIn
和timestamp
之间的日差( 2018-03-03 23:59:59 和 2018-03-04 00:00:01 应该有1)
因此,我需要
答案 0 :(得分:5)
您可以使用-------------------------------------------------------
Id | name |parentId | path | depth | pathNames
-------------------------------------------------------
55 | Canada | null | null | 0 . | None
77 | Ontario | 55 | /55 | 1 . | Canada
100| Toronto | 77 | /55/77 | 2 . | Canada, Ontario
104| Brampton| 100 | /55/77/100 | 3 . | Canada, Ontario, Toronto
将时间戳转换为日期,并使用from_unixtime
来计算天数差异:
datediff