我正在尝试转换以下数据框
id year week
1 2018 43
1 2019 1
2 2019 4
3 2018 51
放入包含以下列的数据框
id year week year_week
1 2018 43 2018-43
1 2019 1 2019-1
2 2019 4 2019-4
3 2018 51 2018-51
其中“ year_week”是日期时间类型
答案 0 :(得分:0)
您将需要选择一周中的某一天,以便根据该数据创建时间戳。假设这些是ISO weeks,我为开始ISO周的星期一选择了“ 1”(还添加了一列以转换为您的问题中显示的字符串格式)。
如果您确实希望列数据是datetime objects而不是pandas.Timestamp,请参见Converting between datetime and Timestamp objects,以了解需要添加的另一步骤。
from datetime import datetime
import pandas as pd
def year_week(y, w):
return datetime.strptime(f'{y} {w} 1', '%G %V %u')
df = pd.DataFrame([(2018, 43), (2019, 1), (2019, 4), (2018, 51)], columns=['year', 'week'])
df['year_week_ts'] = df.apply(lambda row: year_week(row.year, row.week), axis=1)
df['year_week_str'] = df.apply(lambda row: row.year_week_ts.strftime('%G-%V'), axis=1)
print(df)
# year week year_week_ts year_week_str
# 0 2018 43 2018-10-22 2018-43
# 1 2019 1 2018-12-31 2019-01
# 2 2019 4 2019-01-21 2019-04
# 3 2018 51 2018-12-17 2018-51
# for python 3 versions pre-3.6 use '{} {} 1'.format(y, w) instead of the f string above
答案 1 :(得分:0)
您可能想看看epiweeks软件包!
鉴于您提供的数据并假设使用ISO周编号系统,假设您要创建一个具有周结束日期的列:
from epiweeks import Week
df['ending'] = df.apply(
lambda row: pd.to_datetime(Week(row.year, row.week, 'iso').enddate()),
axis=1
)
这将产生一个日期时间类型的新列。
希望您正在寻找什么。