pd.read_csv添加名为“未命名:0

时间:2018-12-31 13:50:42

标签: python pandas csv

我有一个包含3列的数据框。 我用pd.to_csv(filename)保存 然后使用

重新打开
pd.read_csv(filename, index_col=False)

但是我得到一个包含4列的数据框,最左边的列叫做

  

未命名:0

实际上只是行号。 没有它,我怎么能读取csv?

谢谢!

1 个答案:

答案 0 :(得分:2)

您应该尝试:

pd.read_csv('file.csv', index_col=0)
  

index_col:int或sequence或False,默认为None列用作   DataFrame的行标签。如果给出了序列,则为MultiIndex   用来。如果您的格式错误的文件末尾带有分隔符   每行,您可能会认为index_col = False强制熊猫不要   使用第一列作为索引(行名)

示例数据集:

我从Google那里获取了数据集,因此,当我只是尝试使用pd.read_csv导入数据时,它会默认显示Unnamed: 0

>>> df = pd.read_csv("amis.csv")
>>> df.head()
   Unnamed: 0  speed  period  warning  pair
0           1     26       1        1     1
1           2     26       1        1     1
2           3     26       1        1     1
3           4     26       1        1     1
4           5     27       1        1     1

因此,为了避免使用Unnamed: 0,我们必须使用index_col=0并获得更好的数据帧:

>>> df = pd.read_csv("amis.csv", index_col=0)
>>> df.head()
   speed  period  warning  pair
1     26       1        1     1
2     26       1        1     1
3     26       1        1     1
4     26       1        1     1
5     27       1        1     1

注意:因此,为了更清楚地理解我们说的index_col=0,它将第一列作为dataFrame中的索引,而不是显示为Unnamed: 0

希望这会有所帮助。