在熊猫系列解析矢量化日期?

时间:2016-08-04 15:47:13

标签: python pandas text

我的pandas.core.series.Series看起来像这样:

import pandas as pd
s = pd.Series(["1/1/1900 8:00:00 AM", "1/1/1900 8:15:00 PM", "1/1/1900 9:02:11 PM"])

我正在尝试解析时间和AM / PM指标,得到类似的结果:8:00:00 AM

这就是我所拥有的:

s.str.split()

哪个收益率:

0 ['1/1/1900', '8:00:00', 'AM']
1 ['1/1/1900', '8:15:00', 'PM']
2 ['1/1/1900', '9:02:11', 'PM']

从那里开始,做这样的事情来得到我想要的东西是非常微不足道的:

" ".join(s.str.split()[0][1:])

哪个产生

'8:00:00 AM'

虽然如何对这种方法进行矢量化?我有很多约会。

1 个答案:

答案 0 :(得分:1)

IIUC您可以对分割的字符串进行额外的向量化str.join调用:

In [141]:
s = pd.Series(["1/1/1900 8:00:00 AM", "1/1/1900 8:15:00 PM", "1/1/1900 9:02:11 PM"])
s.str.split().str[1:].str.join(" ")

Out[141]:
0    8:00:00 AM
1    8:15:00 PM
2    9:02:11 PM
dtype: object