Pyspark分裂字符串然后相乘

时间:2018-01-03 09:55:43

标签: python apache-spark pyspark

有没有办法在pyspark中的大约两三行代码中执行以下操作?

c1
23:34
00:30

c1  c2
23  34
00  30

然后我们将小时乘以3600和分钟乘以60并将表格相加。

c1 
84840
1800

基本上是从小时数的转换:字符串中的分钟数到数字中的秒数。

1 个答案:

答案 0 :(得分:1)

您只需使用split(),然后执行计算:

from pyspark.sql.functions import split

df.withColumn("test", split("c1", ":")[0] * 3600 +
                      split("c1", ":")[1] * 60)