刚刚开始使用h2o.ai,我喜欢algos和分布式计算,但却坚持数据操作......
我如何在Timestamp('2011-01-01 00:00:00')
和numpy.datetime64('2011-01-02T00:00:00.000000000')
上过滤H2O框架?
因此,例如,我想做相当于这个pandas日期切片
import pandas as pd
import h2o
h2o.init()
dft=pd.DataFrame({'date':pd.date_range('1/1/2011', periods=10), 'value': range(10)})
dft.ix[dft['date']>dft['date'].min()]
dft.ix[dft['date']>dft['date'].values[1]]
我已经失败了
dfh2o=h2o.H2OFrame(dft)
dfh2o[dfh2o['date']>dft['date'].min()] # causes error
dfh2o[dfh2o['date']>dft['date'].values[1]] # causes error
dfh2o['date2']=dfh2o['date'].asdate() # this function doesn't exist
请注意,我希望过滤原始日期值,因为我从其他地方获取它们,并且很难将它们包含在H2OFrame中。那就是我不想要这样的东西
dfh2o[dfh2o['date']>dfh2o['date'].min()]
dfh2o[dfh2o['date']>dfh2o[1,'date']]
而且我不确定H2OFrame如何转换时间戳
dft['date'].astype('int64').min()
Out[16]: 1293840000000000000
dfh2o['date'].min()
Out[17]: 1293858000000.0
答案 0 :(得分:0)