我有一个字符串,我想只提取其中的一些信息。
例如我有这个:
'Won 3 Oscars. Another 80 wins & 121 nominations.'
我想拆分它以获得这样的列表:
['3 Oscars', '80 wins', '121 nominations']
如何使用Python进行操作?
由于
答案 0 :(得分:2)
数字后跟空格,字,然后是字边界。这应该做:
import re
s = 'Won 3 Oscars. Another 80 wins & 121 nominations.'
p = re.compile(r'\d+\s\w+\b')
print(p.findall(s))
# ['3 Oscars', '80 wins', '121 nominations']