我有CSV文件:
lang
12345,it
77777,en
第一行是标题。我的表有一列lang
。在接下来的每一行中,都有两个值:索引和该索引的值。
当我用pd.read_csv(path)
和Pandas一起阅读这张桌子时,我得到的是下一个DataFrame
结构:
lang
12345 it
77777 en
但是当我通过df.to_csv(path)
将其保存回CSV时,在我的CSV文件中的标题之前,我得到了多余的,
:
,lang
12345,it
77777,en
熊猫似乎像未命名的列一样处理此逗号,当我下次读取此文件时,我会得到以下DataFrame
结构:
Unnamed: 0 lang
0 12345 it
1 77777 en
但是我想将第一列另存为索引,另一些另存为普通列。如何在第一列中保存带有索引的DataFrame
?
答案 0 :(得分:1)
第一行模仿您的df示例,其中索引中包含12345。然后,我将其另存为普通的csv。重新读回时,只需将index_col=0
设置为指向pandas
即可读取位置0处的列作为索引。
df.set_index(df.columns[0],inplace=True)
df.to_csv('test.csv')
df_new = pd.read_csv('test.csv', index_col=0)