如何在strip_tags中使用$ xpath

时间:2014-01-29 14:28:40

标签: php dom domdocument domxpath

有人可以帮助我,如何通过$ xpath从这个div中获取最新的P(看下面的plz)标签? 我想,因为,class ='mydiv'中的其他标签会返回错误:

警告:DOMDocument :: loadHTML():实体中的标签文章无效,第xx行中的/ tmp / execpad-35d38cb6bc34 / source-35d38cb6bc34中的第2行

警告:DOMDocument :: loadHTML():实体中的标记头无效,第xx行中的/ tmp / execpad-35d38cb6bc34 / source-35d38cb6bc34中的第2行

警告:DOMDocument :: loadHTML():实体中的标签时间无效,第xx行中的/ tmp / execpad-35d38cb6bc34 / source-35d38cb6bc34中的第2行

警告:DOMDocument :: loadHTML():htmlParseEntityRef:实体中没有名称,第xx行中的/ tmp / execpad-35d38cb6bc34 / source-35d38cb6bc34中的第2行

警告:DOMDocument :: loadHTML():htmlParseEntityRef:实体中没有名称,第xx行中的/ tmp / execpad-35d38cb6bc34 / source-35d38cb6bc34中的第2行

<div class="mydiv" role="main" itemscope="itemscope" itemtype="http://schema.org/Blog">
<!-- google_ad_section_end --><!-- google_ad_section_start -->
<article id="768" class="768" itemscope itemtype="http://schema.org/Article">
<header><h1 itemprop="name" class="entry-title">title here</h1>
<div class="meta-info">
<time itemprop="dateCreated" class="entry-date updated" datetime="2010-08-12T14:07:11+00:00">Aug 14, 2010</time>
<meta itemprop="interactionCount" content="UserComments:9"/><div class="entry-comments-views">
</div></header>
<p>xxxx & xxxx</p>
<p>**i need here** </p>
</div>

我使用此方法获得第二个p标记

$doc = new DOMDocument();
@$doc->loadHTML($html);
$xpath = new DOMXPath($doc);
$index = 2;
$class = 'mydiv';
$tai = $xpath->query(
    sprintf('//div[@class="%s"]/p', $class)
);

我需要从html($ doc)中删除无效标签..

0 个答案:

没有答案