如何重新采样包含分类数据的pandas数据框?

时间:2016-11-06 13:44:08

标签: pandas jupyter-notebook

我有一个包含列的数据框:
  - 机器:[Machine1,Machine2,Machine3,Machine4,Machine5,Machine6]
  - 时间:日期时间27102016 00:00:00 - 00:59:00(每分钟)
  - OutX:整数
  - OutY:整数

数据框包含时间列中时间范围内所有分钟的所有计算机的OutX和OutY读数。

yeild = pd.read_csv("d:/xdata/question.csv",parse_dates=True, index_col='Time')
yeild.dtypes

机器对象
OutX int64
OutY int64
dtype:object

yeild.describe()

........... OutX OutY
数358.000000 358.000000
平均值69.782123 70.715084
std 9.685677 12.451468
分64.000000 66.000000
25%67.000000 68.000000
50%68.000000 69.000000
75%70.000000 70.000000
最大202.000000 246.000000

我想重新采样数据,以便在重采样数据帧中观察到OutX和OutY的最大值(让我们称之为样本)。

sample = yeild.resample('10t').max()

我在采样后只得到6条记录,因为它只接受所有OutX和OutY的最大值 如何重新取样保持不同的分类值(Machine1,Machine2 ... Machine6)保持不变?即,对于所有正在考虑的机器,每10分钟获得最大的OutX和OutY 提前谢谢!

1 个答案:

答案 0 :(得分:0)

这是未经验证的,因为您没有提供任何样本数据,我不想编制数据...我希望它有效

您想了解 {/ 1}} 的位置,并将max与这些位置分开。您可以使用yield

找到 where
idxmax