从同一行和下一行获取值

时间:2018-07-16 03:09:14

标签: regex python-3.x data-extraction

我有一个文本文件,其中包含这种格式的数据。我想拿医生的名字。我可以知道将要处理这两种情况的正则表达式或任何其他方法

The patient is referred by Dr. Zach Foster.


The patient is referred by
Dr. Corey Piccirillo



Output:
Dr. Zach Foster
Dr. Corey Piccirillo

我将以下正则表达式用于第一种情况,然后使用Spacy提取名称:

re(r'.*referred by.*',re.I)

第二种情况:

for line in file:  
   if "referred by" in line:
       print(next(ifile, '').strip())

1 个答案:

答案 0 :(得分:1)

re(r'by[\n\s](Dr.+\.*)',re.I)

将匹配捕获组中的这两种情况。