正则表达式用于非捕获可选

时间:2019-03-20 14:36:16

标签: python regex

我是新手,已经为此困扰了好几天。我想在Python中使用提取到没有URL的普通句子。
例如:

1st text: '(some normal sentences...) https://www.(...)'  
2nd text: '(some normal sentences...) '

当我使用r'([\w+\.\s\W\@w]+)(?:https)'时,它将仅捕获第一文本中的句子。

当我使用r'([\w+\.\s\W\@w]+)(?:https)?'时,它将捕获第二文本和第一文本的所有文本中的句子。

有人可以帮助我的Regex吗?

1 个答案:

答案 0 :(得分:0)

您可以使用t这样的正则表达式,

non greedy