我有一个数据集,其中包含我需要以粗略的时间间隔聚合的单个观察值,作为每个时间间隔的几个指标变量的函数。我假设这里的解决方案是进行groupby
操作,然后进行重新采样:
adult_resampled = adult_data.set_index('culture', drop=False).groupby(['over64','regioneast','pneumo7',
'pneumo13','pneumo23','pneumononPCV','PENR','LEVR',
'ERYTHR','PENS','LEVS','ERYTHS'])['culture'].resample('AS', how='count')
结果是一个带有大量层次索引的笨拙系列,所以这可能不是正确的方法,但我需要将层次索引转换为列。我现在唯一可以做的就是破解分层索引(通过拉出索引标签,这实际上是我需要的列的内容)。
我应该非常感谢任何关于我应该做的事情的提示!
我已经尝试了新的Grouper
语法,但它不允许我随后将层次结构索引更改为数据列。将unstack
应用于此表:
结果如下:
为了使这个数据集有用,比如在回归模型中,我真的需要索引标签作为列中的指示符。