如何在pyspark中将字符串转换为日期

时间:2021-03-26 09:46:50

标签: dataframe pyspark

我有一个从中提取日期的文件名:some_file_name_20201103114823.csv 使用 substring

substring(input_file_name(),16,8)

我提取了日期部分,现在是字符串:20201103

如何将此字符串转换为日期格式:MM-dd-yyyy

1 个答案:

答案 0 :(得分:-1)

这就是我所做的,格式化字符串然后将其转换为日期 - 不漂亮但可以工作:

to_date(concat(substring(input_file_name(),16,4),lit("-"),substring(input_file_name(),20,2),lit("-"),substring(input_file_name(),22,2)),"yyyy-MM-dd")

参考:https://sparkbyexamples.com/pyspark/pyspark-substring-from-a-column/#:~:text=In%20PySpark%2C%20the%20substring(),using%20substring()%20from%20pyspark