在对H2o python进行分组后打印数据帧

时间:2016-07-31 15:53:28

标签: python pandas h2o

数据:" https://github.com/estimate/pandas-exercises/blob/master/baby-names2.csv"
在熊猫中:

df=pd.read_csv("baby-names2.csv")
df_group=df.groupby("year")
print df_group.head()

它打印按年份分组的数据框 我如何在H2o Python中做同样的事情?
在H2o:

df=h2o.upload_file("baby-names2.csv")
df_group=df.group_by("year")
print df_group.head() ==> gives Error

预期产量:
http://i.imgur.com/VTbMX9w.png

1 个答案:

答案 0 :(得分:0)

要在使用groupby()后获取h2o帧,请使用.get_frame()返回group-by的结果。例如,如果您想获得每年的计数,您可以这样做:

df=h2o.import_file("baby-names2.csv")
df_group=df.group_by("year").count()
df_group.get_frame()

which prints the year and count columns