我有一个数据文件。它有几列数据和两列具有相同的名称。当我从这个文件中获取带有数据的pandas框架时,结果是单个实例中存在具有相同名称的列。也就是说,其中一列被重写。
我使用pd.read_table
获取数据,其中pd是pandas
我看了大熊猫的文档,但没有找到适合我的选项。请告诉我在创建一个包含相同列的数据的框架时有一些属性。
对不起我的英语,非常感谢。
答案 0 :(得分:0)
我认为最新版本的pandas(0.19.2
)将.number
添加到相同的列名称中:
temp=u"""A;A;B;B
1;1;1;1
2;3;1;2"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep=";")
print (df)
A A.1 B B.1
0 1 1 1 1
1 2 3 1 2
但是可以通过自定义列表设置名称:
temp=u"""A;A;B;B
1;1;1;1
2;3;1;2"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), sep=";", names= ['w','e','r','t'])
print (df)
w e r t
0 A A B B
1 1 1 1 1
2 2 3 1 2