Pyspark,在字符串中间添加一个字符

时间:2018-01-02 14:23:29

标签: python apache-spark split pyspark

我们说我有一个像这样的字符串列

Hour
0045
2322

我希望它变成这样:

Hour
00:45
23:22   

为了变成时间戳之后。 我该怎么做呢?

1 个答案:

答案 0 :(得分:5)

您可以使用regexp_replace

from pyspark.sql.functions import col, regexp_replace

df.withColumn("Hour", regexp_replace(col("Hour") ,  "(\\d{2})(\\d{2})" , "$1:$2" ) ).show()

+-----+
| hour|
+-----+
|00:45|
|00:50|
+-----+