Question

我的数据框有192列：第一列是时间，第二列是值。这两列属于一个特定的字段数据。第三列是时间，第四列是值，这两列属于另一个字段。同样，我有来自96个字段（日期时间戳和值）的数据，这些数据导致192列。这是两年的数据。每天，一个字段将有大约200个样本。所有96个字段都是相同的。

我正在尝试查找给定字段每天的最大值。我想将此最大值沿该字段命名的列存储，并与日期一起存储在称为max_data的数据框中。以后可以再次使用。同样，我将复制所有其他文件，并将其值存储在max_data中。
我想绘制出max_data数据框的每天的最大值吗？

我的代码：

.
for i,j in zip(modules_pmpp_df.columns[::2],modules_pmpp_df.columns[1::2]):
    modules_pmpp_df[i] = pd.to_datetime(modules_pmpp_df[i])
    print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max)

当前输出为：

<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x0000000004E3F518>>
<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x0000000008020C88>>
<bound method GroupBy.max of <pandas.core.groupby.groupby.SeriesGroupBy object at 0x00000000560AA668>>
.
.

根据@jezrael修改的代码将提供以下输出：

print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max())

输出为：

TypeError: '>=' not supported between instances of 'str' and 'float'

根据@ U9-Forward修改的代码将提供以下输出：

print(modules_pmpp_df.groupby(modules_pmpp_df[i].dt.strftime('%B'))[j].max(axis=1))

输出为：

TypeError: '>=' not supported between instances of 'str' and 'float'

我的数据帧的groupby输出是一些十六进制，但不是值？为什么？

0 个答案: