应用错误收集

我有一个60行，超过5000列的数据框。数据以相同的格式从电子表格中导入。每行代表一个特定的日期（每15年一次，每季15 x 4 = 60），而列则由85个不同的公司和60个变量（85 * 60 = 5100）组成

很遗憾，我无法发布数据，但这是df.head（）的示例（参见图片）

我的问题是过滤和管理数据的最佳方法是什么。我应该在数据框中使用muli-index吗？数据透视表还是分组依据？

到目前为止，我认为最佳的方法是：

# Series a - for one company and one metric over time #

#Criteria
Ticker = df.loc[0,:]=="Company1"  
Metric = df.loc[2,:]=="Sales"
a=df.loc[:,Ticker & Metric][![enter image description here][1]][1]

我应该在数据框中使用多索引吗？

0 个答案: