我正在尝试使用正则表达式从文本中删除所有标点符号。问题是,标点符号正则表达式似乎没有任何效果(\p{P}
和\p{Punct}
)。
import re
hello_world = 'Hello, world!'
hello_world = re.sub('\p{Punct}', '', hello_world)
print(hello_world)
我做错了吗?以下产生了预期的效果,但我仍然不明白为什么上面的代码不起作用。
# import string
# ...
hello_world = re.sub('[{}]'.format(string.punctuation), '', hello_world)