我有一个要导入到h2o中的.csv文件,其日期存储为“ YYYY-mm-dd”格式。当我通过R将其导入h2o时,这些列将作为1970年以来的时间(毫秒)读入(如此处列出的问题-https://0xdata.atlassian.net/browse/PUBDEV-3434所解释)。
> head(data.hex$date_used_dt)
date_used_dt
1 1489449600000
2 1520380800000
3 1469491200000
4 1465862400000
5 1464912000000
6 1516147200000
我需要将此列转换为日期格式。 h2o.as_date()不能工作,因为这不是一个因素或字符串。是否有将时间变量从h2o转换为h2o内的日期 的函数?像h2o.as_date()之类的东西,但是可以用于时间变量吗?我需要将此数据集保存在水里。
答案 0 :(得分:1)
h2o内的所有日期都这样表示。即使您使用日期的字符列(“ 2018-01-01”)并且使用h2o.as_date(),它也将以毫秒为单位表示。
如果要过滤日期,可以使用h2o.day
,h2o.month
和h2o.year
函数。
data.hex[h2o.day(data.hex$date_used_dt) == 5, ]
(如果您只希望每月的第5天)。
如果只想了解2017年12月,则可以使用data.hex[h2o.year(data.hex$date_used_dt) == 2017 & h2o.month(data.hex$date_used_dt) == 12, ]
之类的月份和年份的组合。