有没有办法在pyspark中的大约两三行代码中执行以下操作?
c1
23:34
00:30
c1 c2
23 34
00 30
然后我们将小时乘以3600和分钟乘以60并将表格相加。
c1
84840
1800
基本上是从小时数的转换:字符串中的分钟数到数字中的秒数。
答案 0 :(得分:1)
您只需使用split()
,然后执行计算:
from pyspark.sql.functions import split
df.withColumn("test", split("c1", ":")[0] * 3600 +
split("c1", ":")[1] * 60)