Question

我正在导入csv文件。有一个“日期”列有一天，然后有几个（~20）其他列有时间。我曾尝试将parse_dates =与read_cv一起使用，但是当我组合多于一对列时，我得到一个“ValueError：Date列到达已经在dict中”到达是第二列要在parse_dates =字典中读取。这是我正在做的（简短的例子）：

df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id', 
               parse_dates={'sch_appt_time_':['date', 'sch_appt_time'],
                            'arrival':['date', 'arrival']})

如果我在解析它时重命名列：

df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id', 
               parse_dates={'d_sch_appt_time_':['date', 'sch_appt_time'],
                            'd_arrival':['date', 'arrival']})

我尝试在导入后重命名列

df.columns = ['sch_appt_time_', 'arrival', 'other', 'columns...']

这种方法的问题在于，如果我在parse_dates字典中进行任何更改，列的顺序会发生变化，因此重命名不再有效。

我的目标是使用与cvs文件中相同的列名。最好的方法是什么？

使用pandas read_csv解析多个日期列组合

0 个答案: