我正在编写一个程序,通过用一系列数字复制它来压缩文本 - 但我不知道如何让程序将标点符号识别为列表中的单独项目。
例如,在带有逗号的句子中,逗号表示使用'comma,'
时单词'comma'
和split()
不同。我希望改为'comma' ',' 'comma'
。
我不想摆脱标点符号 - 我希望它作为列表中的单独项目
答案 0 :(得分:4)
您可以像这样使用re.split
:
>>> re.split('([{}])'.format(re.escape(string.punctuation)), "comma,comma")
['comma', ',', 'comma']