Question

我有一个.xlsx文件，其格式类似于...（请注意，第一行是描述性的，并不意味着它们是列标题。标题位于第2行）

SHEET SUBJECT, Listings for 2010,,,,
Date, Name, Name_2, Abr, Number,         <--- I want this as column headers
12/01/2010, Company Name, Somecity, Chi, 36,
12/02/2010, Company Name, Someothercity, Nyc, 156,

因此，当我执行this_df = pd.read_excel('filename.xlsx')时，会得到SHEET SUBJECT和Listings for 2010，后面是一系列未命名的列标题。期望的，不是我想要的。

当我做this_df.columns = this_df.iloc[1]时，假设我将从索引1的行中获取列标题设置，而是从索引2的行中获取数据值。

我想念什么？谢谢。

Answer 1

也许您可以在阅读excel时进行修复

df=pd.read_excel(r'TT.xlsx',skiprows=1)
df
Out[367]: 
        Date           Name          Name_2   Abr   Number           
0 2010-12-01   Company Name        Somecity   Chi       36        NaN
1 2010-12-02   Company Name   Someothercity   Nyc      156        NaN

Answer 2

在读取Excel文件时只需指定标题的行索引：

pd.read_excel('filename.xlsx', header = 1)

Python Pandas：我无法将第二行设置为列标题

2 个答案: