我需要捕获所有字符串,如(\ w \ s),最小长度为3,使用Python regex for findall方法。这是:找到尽可能多的“单词”(子串),它们由至少3个串联组成。
例如,对于:
This is an e x a m p l e about T H I S question.
findall应该返回:
["e x a m p l e ", "T H I S "]
已经尝试过:
\S\S+(\w\s+){3,}\S+
答案 0 :(得分:6)
使用以下方法使用特定的正则表达式模式:
s = 'This is an e x a m p l e about T H I S question.'
result = re.findall(r'\b((?:\w\s){3,})', s)
print(result)
输出:
['e x a m p l e ', 'T H I S ']