我们说我有一个像这样的字符串列
Hour
0045
2322
我希望它变成这样:
Hour
00:45
23:22
为了变成时间戳之后。 我该怎么做呢?
答案 0 :(得分:5)
您可以使用regexp_replace
from pyspark.sql.functions import col, regexp_replace
df.withColumn("Hour", regexp_replace(col("Hour") , "(\\d{2})(\\d{2})" , "$1:$2" ) ).show()
+-----+
| hour|
+-----+
|00:45|
|00:50|
+-----+