我试图遍历几个Excel工作表并将特定信息(每个工作表中名为“ Value”的列)提取到单个DataFrame对象中。
我执行以下操作:
import pandas as pd
import numpy as np
df=pd.read_excel("file / path", sheet_name=None)
然后,将df作为OrderedDict和其中的其他一些数据结构来获取。看起来像这样:
([('Austria',
Name Value
0 3 BG EMCore Convertibles Global CHF R T 5
1 3 BG EMCore Convertibles Global R T 6
[2 rows x 2 columns]),
('Belgium',
Name Value
0 AG Life Alternative Investments 7
1 AG Life Balanced 1
2 AG Life Bonds Global 2
3 AG Life Bonds Indexed 7
[4 rows x 2 columns])])
问题是我不知道如何进一步分解和检查此数据结构中的元素。我最终希望从上述数据结构中创建一个仅包含“值”的DataFrame。列的名称可以是任何名称;最好是国家名称。看起来像这样:
Austria Belgium
0 5 7
1 6 1
2 NaN 2
3 NaN 7