我有一个包含3列的数据框。
我用pd.to_csv(filename)
保存
然后使用
pd.read_csv(filename, index_col=False)
但是我得到一个包含4列的数据框,最左边的列叫做
未命名:0
实际上只是行号。 没有它,我怎么能读取csv?
谢谢!
答案 0 :(得分:2)
您应该尝试:
pd.read_csv('file.csv', index_col=0)
index_col:int或sequence或False,默认为None列用作 DataFrame的行标签。如果给出了序列,则为MultiIndex 用来。如果您的格式错误的文件末尾带有分隔符 每行,您可能会认为index_col = False强制熊猫不要 使用第一列作为索引(行名)
示例数据集:
我从Google那里获取了数据集,因此,当我只是尝试使用pd.read_csv导入数据时,它会默认显示Unnamed: 0
。
>>> df = pd.read_csv("amis.csv")
>>> df.head()
Unnamed: 0 speed period warning pair
0 1 26 1 1 1
1 2 26 1 1 1
2 3 26 1 1 1
3 4 26 1 1 1
4 5 27 1 1 1
因此,为了避免使用Unnamed: 0
,我们必须使用index_col=0
并获得更好的数据帧:
>>> df = pd.read_csv("amis.csv", index_col=0)
>>> df.head()
speed period warning pair
1 26 1 1 1
2 26 1 1 1
3 26 1 1 1
4 26 1 1 1
5 27 1 1 1
注意:因此,为了更清楚地理解我们说的index_col=0
,它将第一列作为dataFrame中的索引,而不是显示为Unnamed: 0
。
希望这会有所帮助。