读取CSV文件时合并重复的列

时间:2019-03-04 07:51:29

标签: python pandas

给出一个具有重复列A的CSV文件,我需要读取该文件,但不包括重复列-

 A       A       C
306     306     506
3238    3238    591
4159    4159    366
1847    1847    2898

可用的替代选项包括usecolsnames。但是,在Pandas version 0.24.1中我们也有mangle_dupe_cols参数,如果将其设置为False,则应合并docs中提到的重复列。

但是,当我这样做时,出现ValueError-

pd.read_csv('file.csv', mangle_dupe_cols=False, engine='python').head()
ValueError: Setting mangle_dupe_cols=False is not supported yet

用于此问题的熊猫版本-0.24.1

您对此问题有何看法?

1 个答案:

答案 0 :(得分:2)

我检查了熊猫github并发现了ENH: Support mangle_dupe_cols=False in pd.read_csv()

不幸的是,comment的答案是this comment

  

此问题上的预计到达时间是什么?

     

何时/如果发生社区请求请求

一种可能的解决方案是两次读取文件:

c = pd.read_csv('some.csv', header=None, nrows=1).iloc[0]
#or
#with open('some.csv', newline='') as f:
#  reader = csv.reader(f)
#  c = next(reader)

df = pd.read_csv('some.csv', header=None, skiprows=1)
df.columns = c