正则表达式使字符串有意义。蟒

时间:2016-11-10 07:51:04

标签: python regex

如何从字符串

中删除非英语单词(词汇)

例如:

puppies monitoring_string = c1299fe10ba49eb54f197dd4f735fcdc dogtime

如何删除所有非英语单词,保留词汇: 我想得到的结果是:

puppies monitoring string dogtime

puppies monitoring string  ....or others

目的是使字符串有意义。

我试过的是:

re.sub('[^A-Za-z0-9]+', ' ', string)
result:   puppies monitoring string c1299fe10ba49eb54f197dd4f735fcdc dogtime

1 个答案:

答案 0 :(得分:0)

不能想到任何逻辑词拥有非词不具备。

首先,也许你可以尝试删除带有数字的单词。

正则表达式\w*\d\w*应该找到带有数字和数字的字母组合。