我使用.csv
在R-H2o中上传h2o.importFile
个文件。但是,日期值的解析不正确。
例如,对于日期时间格式YYYY-MM-DD hh:mm:ss
,(例如2016-06-16 12:30:00
),结果始终为1466073000000
,这是不正确的。
答案 0 :(得分:1)
这是数据导入工件的奇怪组合:
这是一个纪元时间,从1970年1月1日起的秒数。
如果您使用此代码:
numDate <- 1466073000 #notice I removed three zeros
as.POSIXct(numDate, origin="1970-01-01")
您将获得以下输出:
"2016-06-16 06:30:00 EDT"
所以,它在几毫秒内。 此外,时间不正确,持续6个小时。
有可能为您的系统时区提供格林威治标准时间调整(如果您在公司系统中工作,则可能与当前时区不同,具体取决于实际处理器的位置以及系统的设置方式)
你有选择:
在纪元时间运行分析 要么 转换使用:
as.POSIXct( 1466073000000/1000, origin="1970-01-01")
尝试强制h2o以你想要的方式带来它。
只要此时间(区域调整)是正确的,除非您需要能够正确读取,否则没有理由更改它。我会在分析运行后更改输出,使其具有人类可读性。