Question

我正在学习正则表达式，并在两个部分编号之间提取一个段落。任何评论都非常感谢！

我想要实现的一点信息。我想从贷款合同中提取“保密性”部分。因此，我的段落将以节号和“机密性”一词开头。它将在下一个部分编号处停止。

这是我的代码：

with open('filename.txt') as f:
confi=  re.findall(r'\d{1,2}\.\d{1,2}\s*Confidentiality\.\s*(.*?)\d{1,2}\.\d{1,2}',f.read(), re.DOTALL)

这是示例段落：

13.18机密性。如果任何借款人向代理人，楼层平面图代理人或任何放款人提供，则（…）本部分 13.18 下的保密义务不适用于信息的此类部分（…）参与者，准受让人和同意受本第13.18条条款约束的参与者，（…）根据本协议强加于此的信息。 13.19放弃陪审团审判。

但是，代码没有捕获13.18和13.19之间的段落，而是捕获到该段落中间的“ Section 13.18”。复杂的是，节号并不总是保持为13.18，而是随不同的文本文件而变化。感谢您的评论！