我正在使用simplehtmldom在网站中查找特定元素。
我的代码
function strpos_arr($haystack) {
$needle = array('menu', 'nav');
if(!is_array($needle)) $needle = array($needle);
foreach($needle as $what) {
if(($pos = strpos($haystack, $what))!==false)
return true;
}
return false;
}
$first = true;
foreach($html->find('ul') as $ul){
if ( strpos_arr($ul->id) OR strpos_arr($ul->class) ) {
if ( $first )
{
foreach($ul->find('li a') as $li)
{
echo $li.'<br>';
}
$first = false;
}
}
}
?>
此代码显示所有li元素中的所有链接,包括嵌套在li元素下的ul元素内的链接。我只需要回显一下li中的主要元素,而不是那些嵌套在ul subs下的元素。
修改
所需的行标记为“我需要的href”
<ul id="parent">
<li>a href I need<li>
<li>a href I need<li>
<li>a href I need<li>
<li>a href I need<li>
<ul id="sub">
<li>a href I DON'T need<li>
<li>a href I DON'T need<li>
</ul>
<li>a href I need<li>
<li>a href I need<li>
</ul>
答案 0 :(得分:0)
我尝试使用CSS选择器来过滤元素,但它不起作用......所以我使用DOM函数来确保实际元素的父元素是parent
这是一个工作代码,为您提供所请求的li
个节点:
$text = '
<ul id="parent">
<li>a href I need</li>
<li>a href I need</li>
<li>a href I need</li>
<li>a href I need</li>
<ul id="sub">
<li>a href I DON\'T need</li>
<li>a href I DON\'T need</li>
</ul>
<li>a href I need</li>
<li>a href I need</li>
</ul>';
//Create a DOM object
$html = new simple_html_dom();
// Load HTML from a string
$html->load($text);
// Find li elmenets within ul tags
$list = $html->find('ul+li');
// Find succeeded
if ($list) {
echo "<br/> Found ". count($list);
// Display output as code
echo "<pre>";
foreach ($list as $key => $elm) {
if($elm->parent()->id == "parent") {
echo htmlentities($elm->outertext);
echo "<hr/>";
}
}
echo "</pre>";
}
else
echo "Find function failed !";