我有一个包含列的数据框:
- 机器:[Machine1,Machine2,Machine3,Machine4,Machine5,Machine6]
- 时间:日期时间27102016 00:00:00 - 00:59:00(每分钟)
- OutX:整数
- OutY:整数
数据框包含时间列中时间范围内所有分钟的所有计算机的OutX和OutY读数。
yeild = pd.read_csv("d:/xdata/question.csv",parse_dates=True, index_col='Time')
yeild.dtypes
机器对象
OutX int64
OutY int64
dtype:object
yeild.describe()
........... OutX OutY
数358.000000 358.000000
平均值69.782123 70.715084
std 9.685677 12.451468
分64.000000 66.000000
25%67.000000 68.000000
50%68.000000 69.000000
75%70.000000 70.000000
最大202.000000 246.000000
我想重新采样数据,以便在重采样数据帧中观察到OutX和OutY的最大值(让我们称之为样本)。
sample = yeild.resample('10t').max()
我在采样后只得到6条记录,因为它只接受所有OutX和OutY的最大值 如何重新取样保持不同的分类值(Machine1,Machine2 ... Machine6)保持不变?即,对于所有正在考虑的机器,每10分钟获得最大的OutX和OutY 提前谢谢!
答案 0 :(得分:0)
这是未经验证的,因为您没有提供任何样本数据,我不想编制数据...我希望它有效
您想了解 {/ 1}} 的位置,并将max
与这些位置分开。您可以使用yield
idxmax