Question

我有一个包含列的数据框：
- 机器：[Machine1，Machine2，Machine3，Machine4，Machine5，Machine6]
- 时间：日期时间27102016 00:00:00 - 00:59:00（每分钟）
- OutX：整数
- OutY：整数

数据框包含时间列中时间范围内所有分钟的所有计算机的OutX和OutY读数。

yeild = pd.read_csv("d:/xdata/question.csv",parse_dates=True, index_col='Time')
yeild.dtypes

机器对象
OutX int64
OutY int64
dtype：object

yeild.describe()

........... OutX OutY
数358.000000 358.000000
平均值69.782123 70.715084
std 9.685677 12.451468
分64.000000 66.000000
25％67.000000 68.000000
50％68.000000 69.000000
75％70.000000 70.000000
最大202.000000 246.000000

我想重新采样数据，以便在重采样数据帧中观察到OutX和OutY的最大值（让我们称之为样本）。

sample = yeild.resample('10t').max()

我在采样后只得到6条记录，因为它只接受所有OutX和OutY的最大值如何重新取样保持不同的分类值（Machine1，Machine2 ... Machine6）保持不变？即，对于所有正在考虑的机器，每10分钟获得最大的OutX和OutY 提前谢谢！

Answer 1

这是未经验证的，因为您没有提供任何样本数据，我不想编制数据...我希望它有效

您想了解 {/ 1}} 的位置，并将max与这些位置分开。您可以使用yield

找到 where

idxmax

如何重新采样包含分类数据的pandas数据框？

1 个答案: