我有一个文本文件,其中包含这种格式的数据。我想拿医生的名字。我可以知道将要处理这两种情况的正则表达式或任何其他方法
The patient is referred by Dr. Zach Foster.
The patient is referred by
Dr. Corey Piccirillo
Output:
Dr. Zach Foster
Dr. Corey Piccirillo
我将以下正则表达式用于第一种情况,然后使用Spacy提取名称:
re(r'.*referred by.*',re.I)
第二种情况:
for line in file:
if "referred by" in line:
print(next(ifile, '').strip())
答案 0 :(得分:1)
re(r'by[\n\s](Dr.+\.*)',re.I)
将匹配捕获组中的这两种情况。