Question

我想读取一个具有部分标题的文件，即某些列的名称有些没有。我想按原样读取文件。因此，我想保留已经具有名称的列的名称以及其余的名称。有没有在熊猫中做到这一点的干净方法？

Answer 1

例如，如果您缺少第1,2列的列名。通过熊猫正常读取文件后，您将具有此结构

df.head()
    Unnamed: 0  Unnamed: 1  col3       col4      col5
0    ..            ..
1     ..           ..

阅读df后，您可以按以下方式重命名未命名的列

df.rename(columns = {'Unnamed: 1':'Col1','Unnamed: 2':'Col2'})

Answer 2

这个问题的简短答案是“否”，因为pandas数据框不能有多个空列名，因此，如果您尝试导入具有多个空列名的.csv文件，则不会获得预期的行为：熊猫将使用Unnamed: 0，Unnamed: 1 ...等填充空白列名（如果在.csv文件中用空格代替列名，则可以用其他方式填充）。

例如，this .csv文件已删除了索引为0、3、4、5的列...

,Doe,120 jefferson st.,,, 
Jack,McGinnis,220 hobo Av.,Phila, PA,09119
"John ""Da Man""",Repici,120 Jefferson St.,Riverside, NJ,08075
Stephen,Tyler,"7452 Terrace ""At the Plaza"" road",SomeTown,SD, 91234
,Blankman,,SomeTown, SD, 00298
"Joan ""the bone"", Anne",Jet,"9th, at Terrace plc",Desert City,CO,00123

...将通过以下方式导入：

              Unnamed: 0       Doe                 120 jefferson st.   Unnamed: 3 Unnamed: 4       
0                   Jack  McGinnis                      220 hobo Av.        Phila         PA   9119
1          John "Da Man"    Repici                 120 Jefferson St.    Riverside         NJ   8075
2                Stephen     Tyler  7452 Terrace "At the Plaza" road     SomeTown         SD  91234
3                    NaN  Blankman                               NaN     SomeTown         SD    298
4  Joan "the bone", Anne       Jet               9th, at Terrace plc  Desert City         CO    123

熊猫读取带有部分标题的数据框

2 个答案: