查找每个业务季度大熊猫的最大列数

时间:2015-07-10 13:09:16

标签: python pandas

假设我有以下数据集

import pandas as pd, numpy, datetime

start, end = datetime.datetime(2015, 1, 1), datetime.datetime(2015, 12, 31)
date_list = pd.date_range(start, end, freq='B')
numdays = len(date_list) 

value = numpy.random.normal(loc=1e3, scale=50, size=numdays)
ids = numpy.repeat([1], numdays)

test_df = pd.DataFrame({'Id': ids,
               'Date': date_list,
               'Value': value})

我现在想计算test_df每个业务季度的最大值。一种可能性是使用resample rule='BQ', how='max'。但是,我想保留数组的结构,并为每个BQ生成另一个最大列,你们有没有关于如何做到这一点的建议?

1 个答案:

答案 0 :(得分:1)

我认为以下内容适合您,本季度的这些群组会在“价值”上拨打transform。列,并返回最大值作为系列,其索引与原始df对齐:

In [26]:
test_df['max'] = test_df.groupby(test_df['Date'].dt.quarter)['Value'].transform('max')
test_df
Out[26]:
          Date  Id        Value          max
0   2015-01-01   1  1005.498555  1100.197059
1   2015-01-02   1  1032.235987  1100.197059
2   2015-01-05   1   986.906171  1100.197059
3   2015-01-06   1   984.473338  1100.197059
........
256 2015-12-25   1   997.965285  1145.215837
257 2015-12-28   1   929.652812  1145.215837
258 2015-12-29   1  1086.128017  1145.215837
259 2015-12-30   1   921.663949  1145.215837
260 2015-12-31   1   938.189566  1145.215837

[261 rows x 4 columns]