我在Perl中使用正则表达式时遇到了一些问题。
假设我收到一个字符串,其中嵌入了URI。我想存储每个唯一的URI。
我的问题是该字符串中的URI可能具有不同的格式。有些可能是mylightsaber24.com
,有些可能是http://www.companyabc.co.uk
甚至是www.thisisawebsite.com/index.html?someparameters
。
出于这个原因,Regexp::Common qw /URI/
和Regexp::Common qw/net/
都让我失望:(
任何指针?
非常感谢!
用于识别www.nomansland.com
和nomansland.com
的奖励积分基本相同。