我有一个csv文件,想要选择一个特定的列(日期字符串)。那么我想为每个条目将日期字符串的格式从yyyymmdd
更改为dd.mm.yyyy
。
我用熊猫读取数据框中的csv文件,然后将标题为DATE
的特定列保存到变量中。
import pandas as pd
# read csv file
df = pd.read_csv('csv_file')
# save specific column
df_date_col = df['DATE']
现在我想更改df_date_col
中的值。我怎样才能做到这一点?
我知道我可以像这样先一步:
df['DATE'] = modify(df['DATE'])
是否可以仅使用变量df_date_col
?
如果我尝试df_date_Col['DATE']=...
,它将给出一个KeyError
。
答案 0 :(得分:1)
将to_datetime
与Series.dt.strftime
一起使用:
df['DATE'] = pd.to_datetime(df['DATE'], format='%Y%m%d').dt.strftime('%d.%m.%Y')
使用变量df_date_col是否有可能?
可以,但是可以与Series
一起使用,因此无法再次通过[]
进行选择:
df_date_col = df['DATE']
df_date_col = pd.to_datetime(df_date_col, format='%Y%m%d').dt.strftime('%d.%m.%Y')