管理自定义对象到额外日期和时间的最佳方法

时间:2015-11-14 20:18:29

标签: python pandas

我有一个名为datetime的对象,但它不是日期时间对象。

我必须使用pandas库在Python中使用此列进行一些数据分析。数据最终看起来像这样:

0        2011-01-01 00:00:00
1        2011-01-01 01:00:00
2        2011-01-01 02:00:00
3        2011-01-01 03:00:00
4        2011-01-01 04:00:00
5        2011-01-01 05:00:00
6        2011-01-01 06:00:00
7        2011-01-01 07:00:00

以下是终端所说的日期时间:

datetime       object

现在我想知道将小时数据放入单独的列的最佳方法,以便我可以在回归分析中使用该列。这样做的最佳方法是什么,因为这似乎是一个没有split命令的自定义对象。我还想

最好只是:

  1. 转换为字符串,执行拆分,将月份和小时存储为整数
  2. 转换为datetime并以某种方式提取

2 个答案:

答案 0 :(得分:1)

假设df ['datetime']代表上面的列,那么:

df['hours'] = [ts.hour for ts in pd.to_datetime(df['datetime'])]

这会将日期时间转换为时间戳,然后使用列表推导提取小时。

答案 1 :(得分:0)

或者您可以使用applymap()

df['Hour'] = df.applymap(lambda x: pd.to_datetime(x).hour)