Question

我有CSV文件：

lang
12345,it
77777,en

第一行是标题。我的表有一列lang。在接下来的每一行中，都有两个值：索引和该索引的值。

当我用pd.read_csv(path)和Pandas一起阅读这张桌子时，我得到的是下一个DataFrame结构：

      lang
12345   it
77777   en

但是当我通过df.to_csv(path)将其保存回CSV时，在我的CSV文件中的标题之前，我得到了多余的,：

,lang
12345,it
77777,en

熊猫似乎像未命名的列一样处理此逗号，当我下次读取此文件时，我会得到以下DataFrame结构：

   Unnamed: 0 lang
0       12345   it
1       77777   en

但是我想将第一列另存为索引，另一些另存为普通列。如何在第一列中保存带有索引的DataFrame？

Answer 1

第一行模仿您的df示例，其中索引中包含12345。然后，我将其另存为普通的csv。重新读回时，只需将index_col=0设置为指向pandas即可读取位置0处的列作为索引。

df.set_index(df.columns[0],inplace=True)

df.to_csv('test.csv')
df_new = pd.read_csv('test.csv', index_col=0)