Question

我有这个文件，在下面指定，

.Xls file with multiple header

正如您所看到的，它包含许多标题层，如何在R / Python中读取此文件，以便我能以适当的格式处理它？</ p>

Answer 1

使用Pandas阅读时，您可以手动指定列名。

import pandas as pd

file_name = r"/foo/bar/data.xlsx"
columns = ["Foo", "Bar", "Baz"]

df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)

设置多级列：

df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]})
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")]
df.columns = pd.MultiIndex.from_tuples(columns)

Answer 2

在pandas中你可以看一下Hierarchical indexing（MultiIndex）http://pandas.pydata.org/pandas-docs/stable/advanced.html

但是正如你的正确标题之后那样，通过阅读并应用你自己的列标题，就像“蝙蝠侠”所说的那样

如何在R / Python中读取带有多个头文件的.xls文件进行数据处理？

2 个答案: