我的数据帧的groupby输出是一些十六进制,但不是值?为什么?

时间:2018-08-29 04:56:46

标签: python pandas

我的数据框有192列:第一列是时间,第二列是值。这两列属于一个特定的字段数据。第三列是时间,第四列是值,这两列属于另一个字段。同样,我有来自96个字段(日期时间戳和值)的数据,这些数据导致192列。这是两年的数据。每天,一个字段将有大约200个样本。所有96个字段都是相同的。

  1. 我正在尝试查找给定字段每天的最大值。我想将此最大值沿该字段命名的列存储,并与日期一起存储在称为max_data的数据框中。以后可以再次使用。同样,我将复制所有其他文件,并将其值存储在max_data中。

  2. 我想绘制出max_data数据框的每天的最大值吗?

我的代码:

.
for i,j in zip(modules_pmpp_df.columns[::2],modules_pmpp_df.columns[1::2]):
    modules_pmpp_df[i] = pd.to_datetime(modules_pmpp_df[i])
    print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max)

当前输出为:

<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x0000000004E3F518>>
<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x0000000008020C88>>
<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x00000000560AA668>>
.
.

根据@jezrael修改的代码将提供以下输出:

print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max())

输出为:

TypeError: '>=' not supported between instances of 'str' and 'float'

根据@ U9-Forward修改的代码将提供以下输出:

print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max(axis=1))

输出为:

TypeError: '>=' not supported between instances of 'str' and 'float'

0 个答案:

没有答案