Question

我的pandas.core.series.Series看起来像这样：

import pandas as pd
s = pd.Series(["1/1/1900 8:00:00 AM", "1/1/1900 8:15:00 PM", "1/1/1900 9:02:11 PM"])

我正在尝试解析时间和AM / PM指标，得到类似的结果：8:00:00 AM。

这就是我所拥有的：

s.str.split()

哪个收益率：

0 ['1/1/1900', '8:00:00', 'AM']
1 ['1/1/1900', '8:15:00', 'PM']
2 ['1/1/1900', '9:02:11', 'PM']

从那里开始，做这样的事情来得到我想要的东西是非常微不足道的：

" ".join(s.str.split()[0][1:])

哪个产生

'8:00:00 AM'

虽然如何对这种方法进行矢量化？我有很多约会。

Answer 1

IIUC您可以对分割的字符串进行额外的向量化str.join调用：

In [141]:
s = pd.Series(["1/1/1900 8:00:00 AM", "1/1/1900 8:15:00 PM", "1/1/1900 9:02:11 PM"])
s.str.split().str[1:].str.join(" ")

Out[141]:
0    8:00:00 AM
1    8:15:00 PM
2    9:02:11 PM
dtype: object

在熊猫系列解析矢量化日期？

1 个答案: