我正在学习正则表达式,并在两个部分编号之间提取一个段落。任何评论都非常感谢!
我想要实现的一点信息。我想从贷款合同中提取“保密性”部分。因此,我的段落将以节号和“机密性”一词开头。它将在下一个部分编号处停止。
这是我的代码:
with open('filename.txt') as f:
confi= re.findall(r'\d{1,2}\.\d{1,2}\s*Confidentiality\.\s*(.*?)\d{1,2}\.\d{1,2}',f.read(), re.DOTALL)
这是示例段落:
13.18机密性。如果任何借款人向代理人,楼层平面图代理人或任何放款人提供,则(…)本部分 13.18 下的保密义务不适用于信息的此类部分(…)参与者,准受让人和同意受本第13.18条条款约束的参与者,(…)根据本协议强加于此的信息。 13.19放弃陪审团审判。
但是,代码没有捕获13.18和13.19之间的段落,而是捕获到该段落中间的“ Section 13.18”。复杂的是,节号并不总是保持为13.18,而是随不同的文本文件而变化。感谢您的评论!