使用正则表达式解析版权所有者信息

时间:2016-11-22 04:32:33

标签: regex

我正在寻求解析版权所有者和'Inc',如果出现在各种搞砸格式的版权评论中。如果版权包含日期,我有正则表达式,但我很难想出能够处理这两种情况的东西。

以下是一些示例:

#   Copyright:: 2013-2016 MyCorp, Inc.
#   Copyright:: 2013-2016 MyCorp Inc.
#   Copyright:: 2013-2016 MyCorp Inc.
#   Copyright:: 2009-2010 2013-2016 MyCorp Inc.
#   Copyright:: MyCorp Inc.
#   Copyright:: John Doe

以下是我用于包含日期和公司的版权的内容。有关如何选择匹配'Inc'同时忽略周围环境的任何建议,以及。如果有的话。

[0-9]{4}(?!.*[0-9]{4})(.*)(?:,)? (Inc)(?:.)?

1 个答案:

答案 0 :(得分:1)

我似乎从一个简单的正则表达式获得了相当不错的里程数,甚至没有使用前瞻:

^#   Copyright::(?: (?:\d{4}-\d{4}))* (.*)$

这将匹配可选年份范围之后的所有内容,如果发生的话。

在这里演示:

Regex101