我有一个文本假设
'this is my a,b,c,and d.'
我想要一个与文本对应的列表
['this',' ','is',' ',my,' ','a',',','b',',','c',' ','and',' ','d','.']
。
当前的split()方法消除了分割的元素,并且它不支持多个分割参数。
我想要一个字符串中的列表,该字符串是针对特殊字符拼接而成的,包括列表中的特殊字符。实现它的最简单方法是什么。
答案 0 :(得分:2)
您可以找到所有连续的单词字符和非单词字符。这应该会给你以下结果。
data = 'this is my a,b,c,and d.'
import re
print re.findall(r"\w+|\W+", data)
# ['this', ' ', 'is', ' ', 'my', ' ', 'a', ',', 'b', ',', 'c', ',', 'and', ' ', 'd', '.']