我想读取一个具有部分标题的文件,即某些列的名称有些没有。我想按原样读取文件。因此,我想保留已经具有名称的列的名称以及其余的名称。有没有在熊猫中做到这一点的干净方法?
答案 0 :(得分:0)
例如,如果您缺少第1,2列的列名。通过熊猫正常读取文件后,您将具有此结构
df.head()
Unnamed: 0 Unnamed: 1 col3 col4 col5
0 .. ..
1 .. ..
阅读df后,您可以按以下方式重命名未命名的列
df.rename(columns = {'Unnamed: 1':'Col1','Unnamed: 2':'Col2'})
答案 1 :(得分:0)
这个问题的简短答案是“否”,因为pandas数据框不能有多个空列名,因此,如果您尝试导入具有多个空列名的.csv文件,则不会获得预期的行为:熊猫将使用Unnamed: 0
,Unnamed: 1
...等填充空白列名(如果在.csv文件中用空格代替列名,则可以用其他方式填充)。>
例如,this .csv文件已删除了索引为0、3、4、5的列...
,Doe,120 jefferson st.,,,
Jack,McGinnis,220 hobo Av.,Phila, PA,09119
"John ""Da Man""",Repici,120 Jefferson St.,Riverside, NJ,08075
Stephen,Tyler,"7452 Terrace ""At the Plaza"" road",SomeTown,SD, 91234
,Blankman,,SomeTown, SD, 00298
"Joan ""the bone"", Anne",Jet,"9th, at Terrace plc",Desert City,CO,00123
...将通过以下方式导入:
Unnamed: 0 Doe 120 jefferson st. Unnamed: 3 Unnamed: 4
0 Jack McGinnis 220 hobo Av. Phila PA 9119
1 John "Da Man" Repici 120 Jefferson St. Riverside NJ 8075
2 Stephen Tyler 7452 Terrace "At the Plaza" road SomeTown SD 91234
3 NaN Blankman NaN SomeTown SD 298
4 Joan "the bone", Anne Jet 9th, at Terrace plc Desert City CO 123