我有一个名为datetime的对象,但它不是日期时间对象。
我必须使用pandas库在Python中使用此列进行一些数据分析。数据最终看起来像这样:
0 2011-01-01 00:00:00
1 2011-01-01 01:00:00
2 2011-01-01 02:00:00
3 2011-01-01 03:00:00
4 2011-01-01 04:00:00
5 2011-01-01 05:00:00
6 2011-01-01 06:00:00
7 2011-01-01 07:00:00
以下是终端所说的日期时间:
datetime object
现在我想知道将小时数据放入单独的列的最佳方法,以便我可以在回归分析中使用该列。这样做的最佳方法是什么,因为这似乎是一个没有split命令的自定义对象。我还想
最好只是:
答案 0 :(得分:1)
假设df ['datetime']代表上面的列,那么:
df['hours'] = [ts.hour for ts in pd.to_datetime(df['datetime'])]
这会将日期时间转换为时间戳,然后使用列表推导提取小时。
答案 1 :(得分:0)
或者您可以使用applymap()
df['Hour'] = df.applymap(lambda x: pd.to_datetime(x).hour)