我有一个.xlsx文件,其格式类似于...(请注意,第一行是描述性的,并不意味着它们是列标题。标题位于第2行)
SHEET SUBJECT, Listings for 2010,,,,
Date, Name, Name_2, Abr, Number, <--- I want this as column headers
12/01/2010, Company Name, Somecity, Chi, 36,
12/02/2010, Company Name, Someothercity, Nyc, 156,
因此,当我执行this_df = pd.read_excel('filename.xlsx')
时,会得到SHEET SUBJECT
和Listings for 2010
,后面是一系列未命名的列标题。期望的,不是我想要的。
当我做this_df.columns = this_df.iloc[1]
时,假设我将从索引1的行中获取列标题设置,而是从索引2的行中获取数据值。
我想念什么?谢谢。
答案 0 :(得分:3)
也许您可以在阅读excel时进行修复
df=pd.read_excel(r'TT.xlsx',skiprows=1)
df
Out[367]:
Date Name Name_2 Abr Number
0 2010-12-01 Company Name Somecity Chi 36 NaN
1 2010-12-02 Company Name Someothercity Nyc 156 NaN
答案 1 :(得分:1)
在读取Excel文件时只需指定标题的行索引:
pd.read_excel('filename.xlsx', header = 1)