通过html页面中的regexp获取链接的css文件

时间:2014-01-15 17:11:07

标签: html css regex perl

我尝试解析一个已经加载了perl的html页面。我需要从html-repsone中获取src =“asd / jkl / xyz.css”来操作绝对路径。

我想这样做的原因是,需要在电子邮件头中使用css内联...

所以我试图意识到这一点:

  1. 通过perl
  2. 加载页面
  3. 获取链接css的src
  4. 通过perl
  5. 加载css文件
  6. 解析css并将css文件的内容放在我生成的电子邮件的head-tag中。
  7. 有没有人有更好的想法或工作正则表达式?

1 个答案:

答案 0 :(得分:1)

尝试这样的事情:

#!/usr/bin/env perl

use XML::LibXML;

my $parser = XML::LibXML->new();
my $doc = $parser->load_html(location => "http://mywebsite.com", recover => 2);

print $doc->findnodes('//link[@rel="stylesheet"]/@src');

参考:http://metacpan.org/pod/XML::LibXML