如何将6位数分割成4位数的一列和2位数的一列(例如:201452分为2014和52)

时间:2019-05-15 09:38:38

标签: pyspark

如何在PySpark中将6位数字拆分为4位数字的一列和2位数字的一列(例如:201452分解为2014和52)。应该系统地将第6位数字与第4位数字分开。

我已经尝试过pyspark.split(...)方法,但是无法根据位置拆分6位数字。如何指定此职位?

split_col=py.sql.functions.split(lambda x: df_datetime["WEEKNR"], '4')
df_datetime=df_datetime.withColumn('Name 1', split_col.getItem(0)).show()

1 个答案:

答案 0 :(得分:0)

您只是在寻找功能substring

from pyspark.sql import functions as F

df.withColumn(
    "four_let",
    F.substring(F.col("WEEKNR"), 1, 4)
)