我对python还是很陌生,我正在尝试编写一个正则表达式,该表达式将查找语料库中句点,空格和大写字母的所有实例。 我有这个:
print (re.findall(r'(\.|\!|\?) (A-Z\w+\b)',text))
当只有一个大写字母(即我去看电影)时,我可以打印它,但是当它有一个大写的单词时,我可以打印它。
有想法吗?
答案 0 :(得分:1)
可以通过此方法使用findall
(\.|!|\?) ([A-Z]\w+)
这里不需要边界。
可以用这些替换代替类[。!?],但这不是必需的。
A-Z
是一个类项目,但需要用方括号[]括起来。
Findall每次匹配都会产生两个元素,即标点符号和字母数字字符串。