基于原始熊猫的多索引groupby在原始熊猫中定义新列

时间:2018-06-19 19:53:42

标签: python pandas dataframe

我从一个时间序列中的数据开始,如下所示: original data frame

我正在尝试按ServerTime排序,然后按Symbol排序。这样一来,我将看到类似以下内容的内容:multiindexed dataframe.

我得到第二个:

sec5data = data.groupby(['ServerTime','TotalVol', 'Symbol'])\
               .agg({'Size': np.sum,
                     'Weightedavgprice': np.sum,
                     'FVfirst': 'first',
                     'FVlast': 'last',
                     'Symbol1': 'first',
                     'TotalVol1': 'first',
                     'ServerTime1': 'first',
                     'TimeSymbol': 'first'})

我想要做的是,使原始数据帧中的每一行的FVfirst值变为具有相同ServerTime和相同Symbol的分组数据帧中的相应FVfirst值。

我当前的问题是,由于我在原始数据帧中有400万行,因此似乎没有什么地方可以像我需要的那样快地运行。

基本上我想做的是在每个时间段内将原始数据帧中的每个FVfirst值转换为每个符号中的第一个FVfirst值。

0 个答案:

没有答案