解析csv文件时移位

时间:2017-01-19 11:34:14

标签: apache-spark

我有一个csv文件,每个记录(行)有时间戳。我使用spark csv解析它(我把它包含在Spark 1.5.2中)但是发生了一件奇怪的事情。

我文件中的所有时间戳都移动了3个小时。例如,我的值从2015-12-27 00:00:00开始,以2016-12-28 00:00:00结尾。现在,当我使用Spark解析它时,我得到范围2015-12-27 03:00:002015-12-28 03:00:00的值。

为什么会发生这种情况?处理它的最佳方式是什么?

1 个答案:

答案 0 :(得分:0)

问题在于服务器上的时区与UTC不同。这搞砸了解析,在解析过程中添加了3个小时。