我应该在数据框中使用多索引吗?

时间:2019-04-01 13:49:29

标签: python pandas

enter image description here我有一个60行,超过5000列的数据框。数据以相同的格式从电子表格中导入。每行代表一个特定的日期(每15年一次,每季15 x 4 = 60),而列则由85个不同的公司和60个变量(85 * 60 = 5100)组成

很遗憾,我无法发布数据,但这是df.head()的示例(参见图片)

我的问题是过滤和管理数据的最佳方法是什么。我应该在数据框中使用muli-index吗?数据透视表还是分组依据?

到目前为止,我认为最佳的方法是:

# Series a - for one company and one metric over time #

#Criteria
Ticker = df.loc[0,:]=="Company1"  
Metric = df.loc[2,:]=="Sales"
a=df.loc[:,Ticker & Metric][![enter image description here][1]][1]

0 个答案:

没有答案