我需要在Perl中编写一个正则表达式,它将所有srcs前缀为[perl] texthere [/ perl],如下所示:
<script src="[perl]texthere[/perl]/text"></script>
有任何帮助吗?谢谢!
答案 0 :(得分:2)
使用适当的解析器,例如HTML::TokeParser::Simple:
#!/usr/bin/env perl
use strict; use warnings;
use HTML::TokeParser::Simple;
my $parser = HTML::TokeParser::Simple->new(handle => \*DATA);
while (my $token = $parser->get_token('script')) {
if ($token->is_tag('script')
and defined(my $src = $token->get_attr('src'))) {
$src =~ m{^https?://}
or $token->set_attr('src', "[perl]texthere[/perl]$src");
}
print $token->as_is;
}
__DATA__
<script src="/js/text.text.js/"></script>
And at the same time, ignore scrs that begin with http, as such:
<script src="https://websitewebsitewebsite"></script>
输出:
<script src="[perl]texthere[/perl]/js/text.text.js/"></script> And at the same time, ignore scrs that begin with http, as such: <script src="https://websitewebsitewebsite"></script>
答案 1 :(得分:1)
使用负前瞻模式(在下面第三行):
s{
(<script\s+src\s*=\s*[\'"])
(?!https?://)
}{$1\[perl]texthere[/perl]}gsx;
答案 2 :(得分:0)
我可以匹配任何src =“除了http:^<script src="(?!(https:)).*$
如果有任何问题请告诉我,我会解决它。
尝试使用:this website作为正则表达式教程,使用this website来测试正则表达式。
答案 3 :(得分:0)
这应该有效:
s{(?<=src=)(?!"https?)}{[perl]texthere[/perl]}
测试:
my @olnk = ('<script src=/js/text.text.js/"></script>',
'<script src="https://websitewebsitewebsite"></script>' );
my @nlnk = map {
s{(?<=src=)(?!"https?)}{[perl]texthere[/perl]}; $_
} @olnk;
结果:
print join "\n", @nlnk;
<script src=[perl]texthere[/perl]/js/text.text.js/"></script>
<script src="https://websitewebsitewebsite"></script>
此致
RBO