我有这种日期格式的数据框
Date Week Number Influenza[it] Febbre[it] Rinorrea[it]
0 2008-01-01 1 220 585 103
1 2008-01-08 2 403 915 147
2 2008-01-15 3 366 895 136
3 2008-01-22 4 305 825 136
4 2008-01-29 5 311 837 121
... ...
我想像ISO数据帧一样转换ISO周日期格式的日期格式(因为我需要根据年份和周数将两个数据帧相同的日期相交)。格式类似于“year-weeknumberoftheyear”。
0 2007-42
1 2007-43
2 2007-44
3 2007-45
4 2007-46
... ...
所以我只能以这种方式找到第一个数据帧的ISO周:
wiki = pd.read_csv('file.csv', parse_dates=['Date'])
for i,d in wiki.iterrows():
print d.Date.isocalendar()[1]
输出:
1
2
3
4
...
但我不知道如何制作类似第二个数据帧的日期格式(以“year-weeknumberoftheyear”的方式)
答案 0 :(得分:4)
您可以在读取操作后使用矢量化方法:
df['Date'] = pd.to_datetime(df['Date']).dt.strftime('%Y-%V')
df['Date']
0 2008-01
1 2008-02
2 2008-03
3 2008-04
4 2008-05
Name: Date, dtype: object
此处,%V
是与ISO 8601周数对应的指令。
<强> 演示: 强>
from io import StringIO
data = StringIO(
'''
Date Week Number Influenza[it] Febbre[it] Rinorrea[it]
2008-01-01 1 220 585 103
2008-01-08 2 403 915 147
2008-01-15 3 366 895 136
2008-01-22 4 305 825 136
2008-01-29 5 311 837 121
''')
df = pd.read_csv(data, sep='\s{2,}', parse_dates=['Date'], engine='python')
df
df['Date'].dtypes
dtype('<M8[ns]')
df['Date'].dt.strftime('%Y-%V')
0 2008-01
1 2008-02
2 2008-03
3 2008-04
4 2008-05
Name: Date, dtype: object
编辑: (虽然效率低,仅用于再现性目的)
L = ['{}-{}'.format(d.Date.isocalendar()[0], str(d.Date.isocalendar()[1]).zfill(2)) for i,d in wiki.iterrows()]
构建series
:
>>> pd.Series(L)
0 2008-01
1 2008-02
2 2008-03
3 2008-04
4 2008-05
dtype: object
答案 1 :(得分:0)
time.strftime('%Y-%W')可能适合您。它用于格式化时间。
将pandas导入为pd pd.to_datatime(了time.time())。的strftime( '%Y-%W') '1970-00'将在ouput中出现