Python正则表达式在子弹和发现中找到文本编号清单

时间:2015-05-31 04:50:15

标签: python regex

我正试图在子弹中找到文字。使用python中的正则表达式进行编号

例如

  

InDesign Docs提供了一系列关于使用项目符号和编号来创建轮廓,多级列表,图形标题和编号步骤的文章。

     
      
  1. blah blah blah blah
  2.   
  3. blah2 blah2 blah2
  4.   
  5. blah3 blah3 blah3
  6.   

我想在编号后获取文字&项目符号列表

例如

  等等等等等等   blah2 blah2 blah2
  blah3 blah3 blah3

这是我尝试过的代码:

import re
n= re.compile('\d\.\s+(.*)')
test2= """ test my name is aaaaaa 1. blah blah blah 2. blah2 blah2 blah2 3. blah3 blah3 blah3 4. blah4 blah4 blah4"""
print n.search(test2).group(0)

1 个答案:

答案 0 :(得分:1)

除非您指定re.DOTALL,否则Dot不会与换行符匹配;但是,你需要约束匹配,而不仅仅是匹配文档末尾的所有文本。

此外,您需要将正则表达式字符串中的反斜杠加倍,或使用r'...'字符串语法。

也许r'(\d+\.\s.*\n?)+'可以满足您的需求?