我希望能够生成包含标点符号的列表,但我很难找到解决方案。
示例:“Hello world!我在这里。”
["Hello","world","!","I","am","here","."]
到目前为止,我知道
"Hello World! I am here.".split()
将评估为
['Hello', 'World!', 'I', 'am', 'here.']
答案 0 :(得分:0)
您可以使用regex
:
>>> s="Hello world! I am here."
>>>
>>> import re
>>> re.findall(r'\w+|[^\w\s]',s)
['Hello', 'world', '!', 'I', 'am', 'here', '.']
带有正则表达式re.findall()
的 r'\w+|[^\w\s]'
会找到所有单词字符组合(\w+
)或除字符或空格([^\w\s]
)之外的所有内容。