我有一个60行,超过5000列的数据框。数据以相同的格式从电子表格中导入。每行代表一个特定的日期(每15年一次,每季15 x 4 = 60),而列则由85个不同的公司和60个变量(85 * 60 = 5100)组成
很遗憾,我无法发布数据,但这是df.head()的示例(参见图片)
我的问题是过滤和管理数据的最佳方法是什么。我应该在数据框中使用muli-index吗?数据透视表还是分组依据?
到目前为止,我认为最佳的方法是:
# Series a - for one company and one metric over time #
#Criteria
Ticker = df.loc[0,:]=="Company1"
Metric = df.loc[2,:]=="Sales"
a=df.loc[:,Ticker & Metric][![enter image description here][1]][1]