我正在尝试使用简单的html DOM来提取带有“sitepoint”类的标记内的所有内容。这是我的代码不起作用:
<?php
include_once('simple_html_dom.php');
$html = file_get_html('examplewebsite');
$ret = $html->find('.sitepoint');
echo $ret;
?>
以下是其中一个sitepoint标记(有十个左右)的示例,其中包含我想要的信息。
<dl class="sitepoint">
<dd class="thumbnail">
<a href="blabla" ></a><a href="/toolbar/sidepanel.php?url=random.html" >Get This Now</a> </dd><dt class="notext"><a href="/to/" >Title</a></dt><dd class="starts">
<table width="100%" cellpadding="0" cellspacing="0" border="0">
<tr><td class="textUncolor"> CUT OUT SOME IMAGES AND ADDRESSES HERE
</td></tr>
</table>
</dd>
任何人都可以帮我搞定吗?
答案 0 :(得分:0)
您需要访问outertext属性。
$html->find('.sitepoint',0)->outertext;
查看docs了解详情。看看“魔术属性”
编辑
选择类时,您需要指定您使用的文档中的哪一个。我已经改变了上面的例子来反映这一点。这是经过测试和运作的。 (注意0作为要查找的第二个参数)