Question

我有以下字符串

random_string = '12:58 PM word \n12:20PM person \n12:39PM'

I am doing the following:
re.split(r'[\n]+\d',random_string)

And I get:
['12:58 PM word ', '2:20PM person ', '2:39PM']

But I want:
['12:58 PM word ', '12:20PM person ', '12:39PM']

知道怎么做吗？

Answer 1

在正则表达式中使用前瞻以避免在换行符后匹配数字：

>>> random_string = '12:58 PM word \n12:20PM person \n12:39PM'
>>> re.split(r'\n+(?=\d)', random_string)
['12:58 PM word ', '12:20PM person ', '12:39PM']

当数字位于换行符之后时，正则表达式\n+(?=\d)将在换行符上拆分。
无需将\n放入角色等级。

Answer 2

来自https://docs.python.org/2/library/re.html：

(?=...) 匹配如果...匹配下一个，但不消耗任何字符串。这称为先行断言。例如，Isaac (?=Asimov)只有在'Isaac '之后才匹配'Asimov'。

所以，在你的情况下：

>>> re.split(r'[\n]+(?=\d)', '12:58 PM word \n12:20PM person \n12:39PM')
['12:58 PM word ', '12:20PM person ', '12:39PM']

Python：根据条件进行拆分，但仅拆分部分条件

2 个答案: