Simple Dom Parser - 从结果中剥离链接和特定div

时间:2014-04-11 12:24:39

标签: php html parsing dom simpledom

我正在尝试解析特定div中的一些内容并将其保存到外部文件中。虽然这有效,但我无法做到以下

来自班级league_container

的div
  1. 删除课程bar
  2. 的所有div
  3. 删除所有链接。 (保留文字但删除a及其属性)
  4. 到目前为止我所拥有的是:

       <?php
        include( 'simple_html_dom.php'); 
        $html = file_get_html('https://some.domain.com/');
    
        $divContents = array();
    
        foreach ($html->find('div.league_container') as $div) 
        {
            $divContents[] = $div->outertext;
        }       
    
    
    file_put_contents('parser/est-results.htm', implode(PHP_EOL, $divContents));
    ?>
    

    任何帮助都将不胜感激。

1 个答案:

答案 0 :(得分:0)

使用outertext =

$div->outertext = '';
$a->outertext = $a->text();