re.split(r'\ W +','单词,单词,单词。')输出['单词','单词','单词','']

时间:2018-08-23 06:14:10

标签: python regex

我阅读了Python官方文档中对regex的引用示例 re.split()

>>> re.split(r'\W+', 'Words, words, words.')
['Words', 'words', 'words', '']

我对输出感到困惑,我想它将产生

[",",  ",",  ","]

我认为以下内容显而易见:

In [100]: re.split(r',', 'Words, words, words.')
Out[100]: ['Words', ' words', ' words.']

(r'\W+', 'Words, words, words.'如何输出匹配的内容?

1 个答案:

答案 0 :(得分:1)

\W字符表示不是一个单词(\w)的所有内容,即不是[a-zA-Z0-9_]的所有内容。

在您的情况下,,\W+表达式(一个或多个字符,不是字母数字字符或下划线)匹配,这就是为什么要以字母输出结尾的原因。 / p>