数据:" https://github.com/estimate/pandas-exercises/blob/master/baby-names2.csv"
在熊猫中:
df=pd.read_csv("baby-names2.csv")
df_group=df.groupby("year")
print df_group.head()
它打印按年份分组的数据框
我如何在H2o Python中做同样的事情?
在H2o:
df=h2o.upload_file("baby-names2.csv")
df_group=df.group_by("year")
print df_group.head() ==> gives Error
答案 0 :(得分:0)
要在使用groupby()
后获取h2o帧,请使用.get_frame()
返回group-by的结果。例如,如果您想获得每年的计数,您可以这样做:
df=h2o.import_file("baby-names2.csv")
df_group=df.group_by("year").count()
df_group.get_frame()