我有这个文件,在下面指定,
正如您所看到的,它包含许多标题层,如何在R / Python中读取此文件,以便我能以适当的格式处理它?</ p>
答案 0 :(得分:0)
使用Pandas阅读时,您可以手动指定列名。
import pandas as pd
file_name = r"/foo/bar/data.xlsx"
columns = ["Foo", "Bar", "Baz"]
df = pd.read_excel(file_name, header=None, skiprows=7, names=columns)
设置多级列:
df = pd.DataFrame({'Foo':[1,2,3],'Bar':[2,4,6], "Baz": [3, 6, 9]})
columns = [("Cereals", "Rice", "Autumn"), ("Cereals", "Rice", "Summer"), ("Cereals", "Wheat", "Winter")]
df.columns = pd.MultiIndex.from_tuples(columns)
答案 1 :(得分:0)
在pandas中你可以看一下Hierarchical indexing(MultiIndex)http://pandas.pydata.org/pandas-docs/stable/advanced.html
但是正如你的正确标题之后那样,通过阅读并应用你自己的列标题,就像“蝙蝠侠”所说的那样