大多数pythonic方式搜索文本以查找问题的答案

时间:2016-11-06 22:48:40

标签: python regex

例如,假设我有这个文本。

  

Lorem ipsum dolor坐下来,精神上的精神。法无   condimentum aliquam felis a efficitur。 Nunc vulputate,risus quis   mollis tristique,odio velit tempus urna,quis tincidunt nulla nunc   坐下来。 Maecenas quis quam molestie,hendrerit augue et,

     
      
  1. 你的名字和职业是什么?
  2.         

    我是杰瑞而且我失业了

         
        
    1. 你的家人有多大?
    2.         

      我们有五个人

           

      Etiam ipsum lorem,ullamcorper nec massa id,vulputate gravida sem。   Duis pulvinar lacinia mattis。 Aenean dictum quam sed tincidunt   eleifend。 Suspendisse在cumsan的狮子座中喋喋不休。在viverra odio   非ex egestas,malesuada feugiat justo malesuada。 Curabitur简历

搜索文本最简单的方法是什么,找到问题的答案者?抓住问号和下一个数字之间的所有文本的正则表达式是否有效?干杯。

编辑:这个正则表达式是否有意义? \\?([^]]+)\\[0-9]

1 个答案:

答案 0 :(得分:2)

如果您知道问题将始终与您所显示的当前格式相似(或类似),那么使用以下模式可能会有效:

^.+\?$|(.*)

模式找到所有问题,然后将其他所有问题都捕获到一个组中。可能需要进行一些调整才能准确捕捉到你想要的东西,但这可能是一个很好的起点。

import re

regex = r"^.+\?$|(.*)"

result = re.findall(regex, test_str, re.MULTILINE)

if result:
    for match in result:  
        print(match)

示例:

https://regex101.com/r/bweMiZ/2