我有一个数据框,“日期”列有两种不同类型的日期格式。
eg. 1983-11-10 00:00:00 and 10/11/1983
我希望它们都是同一类型,如何遍历数据框的“日期”列并将日期转换为一种格式?
答案 0 :(得分:0)
我相信您需要to_datetime
中的参数dayfirst=True
:
df = pd.DataFrame({'Date': {0: '1983-11-10 00:00:00', 1: '10/11/1983'}})
print (df)
Date
0 1983-11-10 00:00:00
1 10/11/1983
df['Date'] = pd.to_datetime(df.Date, dayfirst=True)
print (df)
Date
0 1983-11-10
1 1983-11-10
因为:
df['Date'] = pd.to_datetime(df.Date)
print (df)
Date
0 1983-11-10
1 1983-10-11
或者您可以指定两种格式,然后使用combine_first
:
d1 = pd.to_datetime(df.Date, format='%Y-%m-%d %H:%M:%S', errors='coerce')
d2 = pd.to_datetime(df.Date, format='%d/%m/%Y', errors='coerce')
df['Date'] = d1.combine_first(d2)
print (df)
Date
0 1983-11-10
1 1983-11-10
多种格式的通用解决方案:
from functools import reduce
def convert_formats_to_datetimes(col, formats):
out = [pd.to_datetime(col, format=x, errors='coerce') for x in formats]
return reduce(lambda l,r: pd.Series.combine_first(l,r), out)
formats = ['%Y-%m-%d %H:%M:%S', '%d/%m/%Y']
df['Date'] = df['Date'].pipe(convert_formats_to_datetimes, formats)
print (df)
Date
0 1983-11-10
1 1983-11-10
答案 1 :(得分:0)
我希望它们都是相同的类型,如何遍历 我的数据框的“日期”列是否将日期转换为一种格式?
您的输入数据不明确:10 / 11
是11月10日还是10月11日?您需要指定逻辑以确定合适的逻辑。如果要按顺序尝试多种日期格式,该功能很有用:
def date_apply_formats(s, form_lst):
s = pd.to_datetime(s, format=form_lst[0], errors='coerce')
for form in form_lst[1:]:
s = s.fillna(pd.to_datetime(s, format=form, errors='coerce'))
return s
df['Date'] = date_apply_formats(df['Date'], ['%Y-%m-%d %H:%M:%S', '%d/%m/%Y'])
form_lst
中的第一项被赋予优先级。该解决方案可以扩展到任意数量的提供的格式。
答案 2 :(得分:0)
输入日期为 NSECODE日期关闭 1个NSE500 20000103 1291.5500 2 NSE500 20000104 1335.4500 3 NSE500 20000105 1303.8000
history_nseindex_df["Date"] = pd.to_datetime(history_nseindex_df["Date"])
history_nseindex_df["Date"] = history_nseindex_df["Date"].dt.strftime("%Y-%m-%d")
输出现在 NSECode日期关闭 1 NSE500 2000-01-03 1291.5500 2 NSE500 2000-01-04 1335.4500 3 NSE500 2000-01-05 1303.8000