将纪元时间戳列转换为纪元中的每月第一天

时间:2018-10-29 06:30:10

标签: pandas dataframe python-datetime

我有一个纪元时间戳列,如下所述。我需要将这个纪元时间戳列转换为该月的第一天,输出也应该是纪元。

time_stamp
1528974011
1530867602
1530867602
1530867604
1530867602
1528974012
1528974011

示例:上面列1530867602中的第一个值对应于日期时间格式的14/06/2018 11:00:11。现在,同一日期的月份的第一天是01/06/2018,我希望以纪元格式。

这也可以通过以下步骤实现:

epoch->datetime->first_day_of_the_month->epoch_first_day_of_the_month

但是还有更好的方法吗?

谢谢!

请务必提及是否有任何疑问/资源

1 个答案:

答案 0 :(得分:1)

使用:

#convert to datetimes
df['time_stamp'] = pd.to_datetime(df['time_stamp'], unit='s')

#first day of month
df = df.resample('MS', on='time_stamp').first()
print (df)
                    time_stamp
time_stamp                    
2018-06-01 2018-06-14 11:00:11
2018-07-01 2018-07-06 09:00:02

print (df['time_stamp'].index.floor('d'))
DatetimeIndex(['2018-06-01', '2018-07-01'], 
               dtype='datetime64[ns]', name='time_stamp', freq=None)

#remove times and convert to epoch
out = (df['time_stamp'].index.floor('d').astype(np.int64) // 10**9)
print (out)
Int64Index([1527811200, 1530403200], dtype='int64', name='time_stamp')

另一种解决方案是将列转换为月份,然后转换为月份的第一天:

df['time_stamp'] = (pd.to_datetime(df['time_stamp'], unit='s')
                      .dt.to_period('M')
                      .dt.to_timestamp())

然后删除重复项并转换为纪元:

df = df.drop_duplicates('time_stamp').astype(np.int64) // 10**9
print (df)

   time_stamp
0  1527811200
1  1530403200