如何Perl获取元内容

时间:2014-04-15 13:27:21

标签: html perl

此HTML信息

<title>Private Video Link 16:9</title>
<meta content="index,follow,noarchive" name="robots">
<meta content="movie" property="og:type">
<meta content="application/x-shockwave-flash" property="og:video:type">
<meta content="2014_PIW_8102_83462_ocindoor" property="og:title">
<meta content="640" property="og:video:width">
如果我只想打印这一行,那么它是可行的

<meta content="2014_PIW_8102_83462_ocindoor" property="og:title">

这是我的代码

$URL = get ("www.google.com");
$Head = HTML::HeadParser->new;
$Head->parse("$URL");
print $Head->header('Title');

我使用HeadParser

或使用正则表达式

谢谢

2 个答案:

答案 0 :(得分:0)

HTML :: HeadParser并不能完全满足您的需求。 (粗略地看一眼)。

您可以自己在HTML上使用正则表达式。

if ($URL =~ /meta content="\w+" property="og:title"/) {
     print $_;
}

http://www.cs.tut.fi/~jkorpela/perl/regexp.html了解更多是对你的锻炼。

答案 1 :(得分:0)

HTML::TreeBuilder会让你更快乐。链接的文章应该让您了解如何循环类似的树条目。