如何在R / Python中读取带有多个头文件的.xls文件进行数据处理?

时间:2017-02-27 05:28:18

标签: python r dataframe file-read data-processing

我有这个文件,在下面指定,

.Xls file with multiple header

正如您所看到的,它包含许多标题层,如何在R / Python中读取此文件,以便我能以适当的格式处理它?<​​/ p>

2 个答案:

答案 0 :(得分:0)

使用Pandas阅读时,您可以手动指定列名。

import pandas as pd

file_name = r"/foo/bar/data.xlsx"
columns = ["Foo", "Bar", "Baz"]

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)

设置多级列:

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]})
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")]
df.columns = pd.MultiIndex.from_tuples(columns)

答案 1 :(得分:0)

在pandas中你可以看一下Hierarchical indexing(MultiIndex)http://pandas.pydata.org/pandas-docs/stable/advanced.html

但是正如你的正确标题之后那样,通过阅读并应用你自己的列标题,就像“蝙蝠侠”所说的那样