在Python中拆分单词

时间:2015-11-28 05:12:38

标签: python regex string

我正在尝试在python中使用re.split。我想删除所有这些字符,例如" , ; < > { } [ ] / \ ? !。我正在尝试做这样的事情 -

re.split("[, \_!?,;:-]+", word)

如何添加" ( )< > '等字符,以便它们也可以删除?

修改

re.split('\W+',word)

这样可以正常工作但不删除下划线符号。我怎样才能删除下划线?

2 个答案:

答案 0 :(得分:2)

签出str.translate函数,例如在python 2.6 +

line = line.translate(None, " ?.!/;:")

或在python 3 +

line = line.translate(" ?.!/;:")

请参阅Remove specific characters from a string in python

答案 1 :(得分:2)

尝试:

re.split('\W+|\_', word)

还要删除它们:

re.sub('\W+|\_', '', word)

请查看the document了解详情。