如何将“ MM / DD / YYY HH:MM:SS AM / PM”字符串转换为时间戳?

时间:2019-05-25 02:32:05

标签: pyspark

时间戳以字符串形式'12 / 22/2018 04:30:00 PM'出现,但是我需要将其放入24小时时间戳中以匹配其他数据。

我试图手动将sqlContext.read.format设置为无效,但无论如何都将其转换为字符串。

df.printSchema()

root
 |-- Trip ID: string (nullable = true)
 |-- Trip Start Timestamp: string (nullable = true)
 |-- Trip End Timestamp: string (nullable = true)
 |-- Trip Seconds: integer (nullable = true)


当前:

旅行开始时间戳= ['12 / 22/2018 04:30:00 PM']是一个字符串。

正在寻找:

旅行开始时间戳= ['12 / 22/2018 016:30:00']作为时间戳。

1 个答案:

答案 0 :(得分:0)

我在程序中尝试了类似的时间戳字符串。以下代码可能适合您的情况:

df = df.withColumn("new_timestamp",to_timestamp("Trip Start Timestamp","MM/dd/yyyy hh:mm:ss a"))

您可以参考时间戳格式:https://docs.oracle.com/javase/tutorial/i18n/format/simpleDateFormat.html