有没有办法用Pandas数据帧重复行标签?使用xlsxwriter创建的Excel输出当前不会在更高级别重复分组。 我感谢任何帮助。
我的Excel工作表现在如何:
Country State/Province Population
US Califonia 38,802,500
Texas 26,956,958
Florida 19,893,297
...
CAN Alberta 3,645,257
Manitoba 4,400,057
我希望输出具有重复的国家级标签,如下所示
Country State/Province Population
US California 38,802,500
US Texas 26,956,958
US Florida 19,893,297
...
CAN Alberta 3,645,257
CAN Manitoba 4,400,057
答案 0 :(得分:6)
您可以导入Excel数据,然后转发填写相关列:
df = pd.read_excel('data.xlsx')
df.Country.ffill(inplace=True)
>>> df
Country State/Province Population
0 US Califonia 38802500
1 US Texas 26956958
2 US Florida 19893297
3 CAN Alberta 3645257
4 CAN Manitoba 4400057
如果需要,您可以将索引设置为Country和State / Province。
>>> df.set_index(['Country', 'State/Province'])
Population
Country State/Province
US Califonia 38802500
Texas 26956958
Florida 19893297
CAN Alberta 3645257
Manitoba 4400057
然后可以通过df.reset_index()
检索原始DataFrame。
答案 1 :(得分:0)
我不知道大熊猫是否可以做到这一点,但使用简单快速的excel宏可以在几秒钟内完成你想要的事情
答案 2 :(得分:0)
就用
df --> 是您的旋转 DataFrame。
使用下面的,问题就解决了 df = df.reset_index()