在熊猫日期和时间过滤H2OFrame(python)

时间:2017-01-16 16:22:56

标签: python h2o

刚刚开始使用h2o.ai,我喜欢algos和分布式计算,但却坚持数据操作......

我如何在Timestamp('2011-01-01 00:00:00')numpy.datetime64('2011-01-02T00:00:00.000000000')上过滤H2O框架?

因此,例如,我想做相当于这个pandas日期切片

import pandas as pd
import h2o
h2o.init()

dft=pd.DataFrame({'date':pd.date_range('1/1/2011', periods=10), 'value': range(10)})
dft.ix[dft['date']>dft['date'].min()]
dft.ix[dft['date']>dft['date'].values[1]]

我已经失败了

dfh2o=h2o.H2OFrame(dft)
dfh2o[dfh2o['date']>dft['date'].min()] # causes error
dfh2o[dfh2o['date']>dft['date'].values[1]] # causes error
dfh2o['date2']=dfh2o['date'].asdate() # this function doesn't exist

请注意,我希望过滤原始日期值,因为我从其他地方获取它们,并且很难将它们包含在H2OFrame中。那就是我不想要这样的东西

dfh2o[dfh2o['date']>dfh2o['date'].min()]
dfh2o[dfh2o['date']>dfh2o[1,'date']]

而且我不确定H2OFrame如何转换时间戳

dft['date'].astype('int64').min()
Out[16]: 1293840000000000000

dfh2o['date'].min()
Out[17]: 1293858000000.0

1 个答案:

答案 0 :(得分:0)