转换ISO周日期格式的通用日期格式

时间:2016-12-15 15:25:13

标签: python date pandas dataframe iso

我有这种日期格式的数据框

           Date  Week Number   Influenza[it]  Febbre[it]  Rinorrea[it]  
0    2008-01-01             1            220         585           103   
1    2008-01-08             2            403         915           147   
2    2008-01-15             3            366         895           136   
3    2008-01-22             4            305         825           136   
4    2008-01-29             5            311         837           121 
... ...

我想像ISO数据帧一样转换ISO周日期格式的日期格式(因为我需要根据年份和周数将两个数据帧相同的日期相交)。格式类似于“year-weeknumberoftheyear”。

0     2007-42
1     2007-43
2     2007-44
3     2007-45
4     2007-46
... ...

所以我只能以这种方式找到第一个数据帧的ISO周:

wiki = pd.read_csv('file.csv', parse_dates=['Date'])
for i,d in wiki.iterrows():
    print d.Date.isocalendar()[1]

输出:

1
2
3
4
...

但我不知道如何制作类似第二个数据帧的日期格式(以“year-weeknumberoftheyear”的方式)

2 个答案:

答案 0 :(得分:4)

您可以在读取操作后使用矢量化方法:

df['Date'] = pd.to_datetime(df['Date']).dt.strftime('%Y-%V')
df['Date']
0    2008-01
1    2008-02
2    2008-03
3    2008-04
4    2008-05
Name: Date, dtype: object

此处,%V是与ISO 8601周数对应的指令。

<强> 演示:

from io import StringIO
data = StringIO(
'''
Date     Week Number   Influenza[it]  Febbre[it]  Rinorrea[it]  
2008-01-01             1            220         585           103   
2008-01-08             2            403         915           147   
2008-01-15             3            366         895           136   
2008-01-22             4            305         825           136   
2008-01-29             5            311         837           121
''')
df = pd.read_csv(data, sep='\s{2,}', parse_dates=['Date'], engine='python')
df

enter image description here

df['Date'].dtypes
dtype('<M8[ns]')

df['Date'].dt.strftime('%Y-%V')
0    2008-01
1    2008-02
2    2008-03
3    2008-04
4    2008-05
Name: Date, dtype: object

编辑: (虽然效率低,仅用于再现性目的)

L = ['{}-{}'.format(d.Date.isocalendar()[0], str(d.Date.isocalendar()[1]).zfill(2)) for i,d in wiki.iterrows()]

构建series

>>> pd.Series(L)
0    2008-01
1    2008-02
2    2008-03
3    2008-04
4    2008-05
dtype: object

答案 1 :(得分:0)

time.strftime('%Y-%W')可能适合您。它用于格式化时间。

将pandas导入为pd pd.to_datatime(了time.time())。的strftime( '%Y-%W') '1970-00'将在ouput中出现