将日期转换:从年和周数转换为日期时间

时间:2019-03-21 18:11:39

标签: python pandas datetime week-number

我正在尝试转换以下数据框

id  year  week 
 1  2018    43
 1  2019     1
 2  2019     4
 3  2018    51

放入包含以下列的数据框

id  year  week  year_week
 1  2018    43    2018-43
 1  2019     1     2019-1
 2  2019     4     2019-4
 3  2018    51    2018-51

其中“ year_week”是日期时间类型

2 个答案:

答案 0 :(得分:0)

您将需要选择一周中的某一天,以便根据该数据创建时间戳。假设这些是ISO weeks,我为开始ISO周的星期一选择了“ 1”(还添加了一列以转换为您的问题中显示的字符串格式)。

如果您确实希望列数据是datetime objects而不是pandas.Timestamp,请参见Converting between datetime and Timestamp objects,以了解需要添加的另一步骤。

from datetime import datetime
import pandas as pd

def year_week(y, w):
    return datetime.strptime(f'{y} {w} 1', '%G %V %u')

df = pd.DataFrame([(2018, 43), (2019, 1), (2019, 4), (2018, 51)], columns=['year', 'week'])
df['year_week_ts'] = df.apply(lambda row: year_week(row.year, row.week), axis=1)
df['year_week_str'] = df.apply(lambda row: row.year_week_ts.strftime('%G-%V'), axis=1)

print(df)
#    year  week year_week_ts year_week_str
# 0  2018    43   2018-10-22       2018-43
# 1  2019     1   2018-12-31       2019-01
# 2  2019     4   2019-01-21       2019-04
# 3  2018    51   2018-12-17       2018-51

# for python 3 versions pre-3.6 use '{} {} 1'.format(y, w) instead of the f string above

答案 1 :(得分:0)

您可能想看看epiweeks软件包!

鉴于您提供的数据并假设使用ISO周编号系统,假设您要创建一个具有周结束日期的列:

from epiweeks import Week

df['ending'] = df.apply(
        lambda row: pd.to_datetime(Week(row.year, row.week, 'iso').enddate()),
        axis=1
)

这将产生一个日期时间类型的新列。

希望您正在寻找什么。