Python Pandas:我无法将第二行设置为列标题

时间:2018-07-24 20:49:12

标签: python pandas

我有一个.xlsx文件,其格式类似于...(请注意,第一行是描述性的,并不意味着它们是列标题。标题位于第2行)

SHEET SUBJECT, Listings for 2010,,,,
Date, Name, Name_2, Abr, Number,         <--- I want this as column headers
12/01/2010, Company Name, Somecity, Chi, 36,
12/02/2010, Company Name, Someothercity, Nyc, 156,

因此,当我执行this_df = pd.read_excel('filename.xlsx')时,会得到SHEET SUBJECTListings for 2010,后面是一系列未命名的列标题。期望的,不是我想要的。

当我做this_df.columns = this_df.iloc[1]时,假设我将从索引1的行中获取列标题设置,而是从索引2的行中获取数据值。

我想念什么?谢谢。

2 个答案:

答案 0 :(得分:3)

也许您可以在阅读excel时进行修复

df=pd.read_excel(r'TT.xlsx',skiprows=1)
df
Out[367]: 
        Date           Name          Name_2   Abr   Number           
0 2010-12-01   Company Name        Somecity   Chi       36        NaN
1 2010-12-02   Company Name   Someothercity   Nyc      156        NaN

答案 1 :(得分:1)

在读取Excel文件时只需指定标题的行索引:

pd.read_excel('filename.xlsx', header = 1)