给出一个具有重复列A
的CSV文件,我需要读取该文件,但不包括重复列-
A A C
306 306 506
3238 3238 591
4159 4159 366
1847 1847 2898
可用的替代选项包括usecols
和names
。但是,在Pandas version 0.24.1
中我们也有mangle_dupe_cols
参数,如果将其设置为False
,则应合并docs中提到的重复列。
但是,当我这样做时,出现ValueError-
pd.read_csv('file.csv', mangle_dupe_cols=False, engine='python').head()
ValueError: Setting mangle_dupe_cols=False is not supported yet
用于此问题的熊猫版本-0.24.1
您对此问题有何看法?
答案 0 :(得分:2)
我检查了熊猫github并发现了ENH: Support mangle_dupe_cols=False in pd.read_csv()。
不幸的是,comment的答案是this comment:
此问题上的预计到达时间是什么?
何时/如果发生社区请求请求
一种可能的解决方案是两次读取文件:
c = pd.read_csv('some.csv', header=None, nrows=1).iloc[0]
#or
#with open('some.csv', newline='') as f:
# reader = csv.reader(f)
# c = next(reader)
df = pd.read_csv('some.csv', header=None, skiprows=1)
df.columns = c