我正在导入csv文件。有一个“日期”列有一天,然后有几个(~20)其他列有时间。我曾尝试将parse_dates =与read_cv一起使用,但是当我组合多于一对列时,我得到一个“ValueError:Date列到达已经在dict中”到达是第二列要在parse_dates =字典中读取。 这是我正在做的(简短的例子):
df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id',
parse_dates={'sch_appt_time_':['date', 'sch_appt_time'],
'arrival':['date', 'arrival']})
如果我在解析它时重命名列:
df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id',
parse_dates={'d_sch_appt_time_':['date', 'sch_appt_time'],
'd_arrival':['date', 'arrival']})
我尝试在导入后重命名列
df.columns = ['sch_appt_time_', 'arrival', 'other', 'columns...']
这种方法的问题在于,如果我在parse_dates字典中进行任何更改,列的顺序会发生变化,因此重命名不再有效。
我的目标是使用与cvs文件中相同的列名。最好的方法是什么?