将DataFrameGroupBy.resample层次结构索引转换为列

时间:2014-12-05 21:16:12

标签: python pandas

我有一个数据集,其中包含我需要以粗略的时间间隔聚合的单个观察值,作为每个时间间隔的几个指标变量的函数。我假设这里的解决方案是进行groupby操作,然后进行重新采样:

adult_resampled = adult_data.set_index('culture', drop=False).groupby(['over64','regioneast','pneumo7',
            'pneumo13','pneumo23','pneumononPCV','PENR','LEVR',
            'ERYTHR','PENS','LEVS','ERYTHS'])['culture'].resample('AS', how='count')

结果是一个带有大量层次索引的笨拙系列,所以这可能不是正确的方法,但我需要将层次索引转换为列。我现在唯一可以做的就是破解分层索引(通过拉出索引标签,这实际上是我需要的列的内容)。

hack

我应该非常感谢任何关于我应该做的事情的提示!

我已经尝试了新的Grouper语法,但它不允许我随后将层次结构索引更改为数据列。将unstack应用于此表:

Grouper

结果如下:

bad unstack

为了使这个数据集有用,比如在回归模型中,我真的需要索引标签作为列中的指示符。

0 个答案:

没有答案