Python正则表达式用于捕获所有字符串,如(\ w \ s)+

时间:2016-11-26 18:14:05

标签: python regex

我需要捕获所有字符串,如(\ w \ s),最小长度为3,使用Python regex for findall方法。这是:找到尽可能多的“单词”(子串),它们由至少3个串联组成。

例如,对于:

This is an e x a m p l e about T H I S question.

findall应该返回:

["e x a m p l e ", "T H I S "]

已经尝试过:

\S\S+(\w\s+){3,}\S+

1 个答案:

答案 0 :(得分:6)

使用以下方法使用特定的正则表达式模式:

s = 'This is an e x a m p l e about T H I S question.'
result = re.findall(r'\b((?:\w\s){3,})', s)

print(result)

输出:

['e x a m p l e ', 'T H I S ']