时间戳以字符串形式'12 / 22/2018 04:30:00 PM'出现,但是我需要将其放入24小时时间戳中以匹配其他数据。
我试图手动将sqlContext.read.format设置为无效,但无论如何都将其转换为字符串。
df.printSchema()
root
|-- Trip ID: string (nullable = true)
|-- Trip Start Timestamp: string (nullable = true)
|-- Trip End Timestamp: string (nullable = true)
|-- Trip Seconds: integer (nullable = true)
当前:
旅行开始时间戳= ['12 / 22/2018 04:30:00 PM']是一个字符串。
正在寻找:
旅行开始时间戳= ['12 / 22/2018 016:30:00']作为时间戳。
答案 0 :(得分:0)
我在程序中尝试了类似的时间戳字符串。以下代码可能适合您的情况:
df = df.withColumn("new_timestamp",to_timestamp("Trip Start Timestamp","MM/dd/yyyy hh:mm:ss a"))
您可以参考时间戳格式:https://docs.oracle.com/javase/tutorial/i18n/format/simpleDateFormat.html