使用pandas read_csv解析多个日期列组合

时间:2014-11-04 15:03:13

标签: python csv pandas

我正在导入csv文件。有一个“日期”列有一天,然后有几个(~20)其他列有时间。我曾尝试将parse_dates =与read_cv一起使用,但是当我组合多于一对列时,我得到一个“ValueError:Date列到达已经在dict中”到达是第二列要在parse_dates =字典中读取。 这是我正在做的(简短的例子):

df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id', 
               parse_dates={'sch_appt_time_':['date', 'sch_appt_time'],
                            'arrival':['date', 'arrival']})

如果我在解析它时重命名列:

df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id', 
               parse_dates={'d_sch_appt_time_':['date', 'sch_appt_time'],
                            'd_arrival':['date', 'arrival']})

我尝试在导入后重命名列

df.columns = ['sch_appt_time_', 'arrival', 'other', 'columns...']

这种方法的问题在于,如果我在parse_dates字典中进行任何更改,列的顺序会发生变化,因此重命名不再有效。

我的目标是使用与cvs文件中相同的列名。最好的方法是什么?

0 个答案:

没有答案