如何拆分具有多个拆分参数的句子并包括拆分元素

时间:2014-05-13 12:57:04

标签: python regex string list split

我有一个文本假设 'this is my a,b,c,and d.'

我想要一个与文本对应的列表

['this',' ','is',' ',my,' ','a',',','b',',','c',' ','and',' ','d','.']

当前的split()方法消除了分割的元素,并且它不支持多个分割参数。

我想要一个字符串中的列表,该字符串是针对特殊字符拼接而成的,包括列表中的特殊字符。实现它的最简单方法是什么。

1 个答案:

答案 0 :(得分:2)

您可以找到所有连续的单词字符和非单词字符。这应该会给你以下结果。

data = 'this is my a,b,c,and d.'
import re
print re.findall(r"\w+|\W+", data)
# ['this', ' ', 'is', ' ', 'my', ' ', 'a', ',', 'b', ',', 'c', ',', 'and', ' ', 'd', '.']