重复Pandas数据帧行标签

时间:2015-06-15 18:26:06

标签: python excel pandas

有没有办法用Pandas数据帧重复行标签?使用xlsxwriter创建的Excel输出当前不会在更高级别重复分组。 我感谢任何帮助。

我的Excel工作表现在如何:

Country   State/Province    Population
US        Califonia         38,802,500
          Texas             26,956,958
          Florida           19,893,297
...
CAN       Alberta            3,645,257
          Manitoba           4,400,057

我希望输出具有重复的国家级标签,如下所示

Country      State/Province        Population
US           California            38,802,500
US           Texas                 26,956,958
US           Florida               19,893,297
...
CAN          Alberta                3,645,257
CAN          Manitoba               4,400,057

3 个答案:

答案 0 :(得分:6)

您可以导入Excel数据,然后转发填写相关列:

df = pd.read_excel('data.xlsx')
df.Country.ffill(inplace=True)
>>> df
  Country State/Province  Population
0      US      Califonia    38802500
1      US          Texas    26956958
2      US        Florida    19893297
3     CAN        Alberta     3645257
4     CAN       Manitoba     4400057

如果需要,您可以将索引设置为Country和State / Province。

>>> df.set_index(['Country', 'State/Province']) 
                        Population
Country State/Province            
US      Califonia         38802500
        Texas             26956958
        Florida           19893297
CAN     Alberta            3645257
        Manitoba           4400057

然后可以通过df.reset_index()检索原始DataFrame。

答案 1 :(得分:0)

我不知道大熊猫是否可以做到这一点,但使用简单快速的excel宏可以在几秒钟内完成你想要的事情

答案 2 :(得分:0)

就用

df --> 是您的旋转 DataFrame。

使用下面的,问题就解决了 df = df.reset_index()