如何在PySpark中将6位数字拆分为4位数字的一列和2位数字的一列(例如:201452分解为2014和52)。应该系统地将第6位数字与第4位数字分开。
我已经尝试过pyspark.split(...)
方法,但是无法根据位置拆分6位数字。如何指定此职位?
split_col=py.sql.functions.split(lambda x: df_datetime["WEEKNR"], '4')
df_datetime=df_datetime.withColumn('Name 1', split_col.getItem(0)).show()
答案 0 :(得分:0)
您只是在寻找功能substring
from pyspark.sql import functions as F
df.withColumn(
"four_let",
F.substring(F.col("WEEKNR"), 1, 4)
)