正则表达式可在多种情况下匹配版权声明中的公司名称(续2)

时间:2019-03-20 17:17:20

标签: python regex

我发布了这个问题,以获取正则表达式模式以匹配版权声明中的公司名称

Regex to match company names from copyright statements under several conditions

我从中得到了这种模式,该模式适用于我在问题中给出的所有示例:

(?i)(?:©(?:\s*Copyright)?|Copyright(?:\s*©)?)\s*\d+(?:\s*-\s*\d+)?\s*(.*?(?=\W*All\s+rights\s+reserved)|[^.]*(?=\.)|.*)

我认为它可以匹配年份之后和下一个点之前的所有内容,尽管我尝试使用:

  

版权所有©2016 Metasystems。 ERP软件提供商。保留所有权利   保留。

它匹配:“ Metasystems。ERP软件提供商”

在这种情况下,如何更改它以匹配“元系统”,并且对于上一个问题中的所有示例仍然可以正常使用?

1 个答案:

答案 0 :(得分:0)

如果在第一个公司名称之后,您不想使用点号,则可以使用以下方法:

(?:©(?:\s*Copyright)?|Copyright(?:\s*©)?)\s*\d+(?:\s*-\s*\d+)?\s*([^\.\n]*?(?=\W*All\s+rights\s+reserved)|[^.\n]*(?=\.)|.*)

我已将.*?替换为[^\.\n]*?,因此它将接受除点和换行符之外的所有内容。

在此处查看实际操作: https://regex101.com/r/Z707J0/1