如何从字符串
中删除非英语单词(词汇)例如:
puppies monitoring_string = c1299fe10ba49eb54f197dd4f735fcdc dogtime
如何删除所有非英语单词,保留词汇: 我想得到的结果是:
puppies monitoring string dogtime
或
puppies monitoring string ....or others
目的是使字符串有意义。
我试过的是:re.sub('[^A-Za-z0-9]+', ' ', string)
result: puppies monitoring string c1299fe10ba49eb54f197dd4f735fcdc dogtime
答案 0 :(得分:0)
不能想到任何逻辑词拥有非词不具备。
首先,也许你可以尝试删除带有数字的单词。
正则表达式\w*\d\w*
应该找到带有数字和数字的字母组合。