按日期过滤h2o数据集,但在R中作为时间列导入

时间:2018-07-06 18:34:38

标签: r h2o

我有一个要导入到h2o中的.csv文件,其日期存储为“ YYYY-mm-dd”格式。当我通过R将其导入h2o时,这些列将作为1970年以来的时间(毫秒)读入(如此处列出的问题-https://0xdata.atlassian.net/browse/PUBDEV-3434所解释)。

> head(data.hex$date_used_dt)
   date_used_dt
1 1489449600000
2 1520380800000
3 1469491200000
4 1465862400000
5 1464912000000
6 1516147200000

我需要将此列转换为日期格式。 h2o.as_date()不能工作,因为这不是一个因素或字符串。是否有将时间变量从h2o转换为h2o内的日期 的函数?像h2o.as_date()之类的东西,但是可以用于时间变量吗?我需要将此数据集保存在水里。

1 个答案:

答案 0 :(得分:1)

h2o内的所有日期都这样表示。即使您使用日期的字符列(“ 2018-01-01”)并且使用h2o.as_date(),它也将以毫秒为单位表示。

如果要过滤日期,可以使用h2o.dayh2o.monthh2o.year函数。

data.hex[h2o.day(data.hex$date_used_dt) == 5, ](如果您只希望每月的第5天)。

如果只想了解2017年12月,则可以使用data.hex[h2o.year(data.hex$date_used_dt) == 2017 & h2o.month(data.hex$date_used_dt) == 12, ]之类的月份和年份的组合。