我阅读了Python官方文档中对regex的引用示例 re.split()
>>> re.split(r'\W+', 'Words, words, words.')
['Words', 'words', 'words', '']
我对输出感到困惑,我想它将产生
[",", ",", ","]
我认为以下内容显而易见:
In [100]: re.split(r',', 'Words, words, words.')
Out[100]: ['Words', ' words', ' words.']
(r'\W+', 'Words, words, words.'
如何输出匹配的内容?
答案 0 :(得分:1)
\W
字符表示不是一个单词(\w
)的所有内容,即不是[a-zA-Z0-9_]
的所有内容。
在您的情况下,,
与\W+
表达式(一个或多个字符,不是字母数字字符或下划线)匹配,这就是为什么要以字母输出结尾的原因。 / p>