Question

我有一个数据文件。它有几列数据和两列具有相同的名称。当我从这个文件中获取带有数据的pandas框架时，结果是单个实例中存在具有相同名称的列。也就是说，其中一列被重写。

我使用pd.read_table获取数据，其中pd是pandas

我看了大熊猫的文档，但没有找到适合我的选项。请告诉我在创建一个包含相同列的数据的框架时有一些属性。

对不起我的英语，非常感谢。

Answer 1

我认为最新版本的pandas（0.19.2）将.number添加到相同的列名称中：

temp=u"""A;A;B;B
1;1;1;1
2;3;1;2"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep=";")
print (df)
   A  A.1  B  B.1
0  1    1  1    1
1  2    3  1    2

但是可以通过自定义列表设置名称：

temp=u"""A;A;B;B
1;1;1;1
2;3;1;2"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep=";", names= ['w','e','r','t'])
print (df)
   w  e  r  t
0  A  A  B  B
1  1  1  1  1
2  2  3  1  2

熊猫重写专栏

1 个答案: