希望有人可以帮助我。现在已经遍布谷歌了。
我正在做一些zone-ocr文档,并希望用正则表达式提取一些文本。它总是这样:
“Til:名称名称org.nr 12323123”。
我想提取名称部分,它可以是1-4个名字,但“Til:”和“org.nr”总是在前后。
任何?
答案 0 :(得分:1)
使用模式:
Til:(.*)org\.nr
然后取第二组来获取括号之间的内容。
答案 1 :(得分:1)
如果你不能使用捕获组(查看你的文档),你可以试试这个:
(?<=Til:).*?(?=org\.nr)
这个解决方案是使用look back和lookahead断言,但每个正则表达式都不支持这些。如果它们正在工作,这个正则表达式将只返回你想要的部分,因为断言中的部分不匹配,它只检查断言中的模式是否存在。