我正在使用文档,我需要将单词隔离而不使用标点符号。我知道如何使用string.split(“”)来使每个单词只是字母,但标点符号让我感到困惑。
答案 0 :(得分:0)
这是一个使用正则表达式的例子,结果是 ['this','is','a','string','with','punctuation']
s = " ,this ?is a string! with punctuation. "
import re
pattern = re.compile('\w+')
result = pattern.findall(s)
print(result)