PySpark中有提供“分钟”功能吗?

时间:2019-12-26 23:56:29

标签: function pyspark timestamp hour minute

我有一列带有时间戳记。 我想知道是否有一个功能可以为每个时间戳提供“一天的分钟数”。 我正在寻找一个函数给我一个整数作为答案,它显示从一天开始的00:00开始经过了多少分钟。 例如,00:15的时间戳记应为15或01:05的时间戳记应为65或03:15的时间戳记应为195。(基本上应为HH * 60 + MM)

在下面的链接中,我可以找到一个显示“一年中的某天”的函数,但是找不到“一天中的某分钟”的任何函数

https://stackoverflow.com/a/30956282/12305290

提前谢谢!

1 个答案:

答案 0 :(得分:0)

以与建议相同的方式组合PySpark SQL函数hourminute

In [1]: df = spark.createDataFrame([('2015-04-08 13:08:15',)], ['ts'])
df.
In [2]: from pyspark.sql.functions import hour, minute

In [3]: df.withColumn("minutes_since_midnight", hour(df.ts)*60 + minute(df.ts)).show()
+-------------------+----------------------+
|                 ts|minutes_since_midnight|
+-------------------+----------------------+
|2015-04-08 13:08:15|                   788|
+-------------------+----------------------+