我正试图在子弹中找到文字。使用python中的正则表达式进行编号
例如
InDesign Docs提供了一系列关于使用项目符号和编号来创建轮廓,多级列表,图形标题和编号步骤的文章。
- blah blah blah blah
- blah2 blah2 blah2
- blah3 blah3 blah3
醇>
我想在编号后获取文字&项目符号列表
例如
等等等等等等 blah2 blah2 blah2
blah3 blah3 blah3
这是我尝试过的代码:
import re
n= re.compile('\d\.\s+(.*)')
test2= """ test my name is aaaaaa 1. blah blah blah 2. blah2 blah2 blah2 3. blah3 blah3 blah3 4. blah4 blah4 blah4"""
print n.search(test2).group(0)
答案 0 :(得分:1)
除非您指定re.DOTALL
,否则Dot不会与换行符匹配;但是,你需要约束匹配,而不仅仅是匹配文档末尾的所有文本。
此外,您需要将正则表达式字符串中的反斜杠加倍,或使用r'...'
字符串语法。
也许r'(\d+\.\s.*\n?)+'
可以满足您的需求?