例如,假设我有这个文本。
Lorem ipsum dolor坐下来,精神上的精神。法无 condimentum aliquam felis a efficitur。 Nunc vulputate,risus quis mollis tristique,odio velit tempus urna,quis tincidunt nulla nunc 坐下来。 Maecenas quis quam molestie,hendrerit augue et,
- 你的名字和职业是什么?
醇>我是杰瑞而且我失业了
- 你的家人有多大?
醇>我们有五个人
Etiam ipsum lorem,ullamcorper nec massa id,vulputate gravida sem。 Duis pulvinar lacinia mattis。 Aenean dictum quam sed tincidunt eleifend。 Suspendisse在cumsan的狮子座中喋喋不休。在viverra odio 非ex egestas,malesuada feugiat justo malesuada。 Curabitur简历
搜索文本最简单的方法是什么,找到问题的答案者?抓住问号和下一个数字之间的所有文本的正则表达式是否有效?干杯。
编辑:这个正则表达式是否有意义?\\?([^]]+)\\[0-9]
答案 0 :(得分:2)
如果您知道问题将始终与您所显示的当前格式相似(或类似),那么使用以下模式可能会有效:
^.+\?$|(.*)
模式找到所有问题,然后将其他所有问题都捕获到一个组中。可能需要进行一些调整才能准确捕捉到你想要的东西,但这可能是一个很好的起点。
import re
regex = r"^.+\?$|(.*)"
result = re.findall(regex, test_str, re.MULTILINE)
if result:
for match in result:
print(match)
示例:强>