如何在从网页中提取内容时排除某个类?

时间:2017-10-06 13:43:43

标签: php html simple-html-dom

我正在使用 SIMPLE_HTML_DOM 作为我的解析器。

所以这是我已经使用某个div与类获取内容的东西,但是这个div有一个不需要的子div,当我运行解析器时我不想得到它。

    $main_body = $html->find('div[class=storypage-divider desktop]', 0)->plaintext;
    echo $main_body;    

1 个答案:

答案 0 :(得分:0)

您可以选择不需要的子元素并将其删除。

 $main_body = $html->find('div[class=storypage-divider desktop]', 0);
 $main_body->find('div[class=do-not-want]', 0 )->outertext = '';
 echo  $main_body->plaintext;

注意:我没有测试此代码!,并更改了班级名称"不想要"

希望有所帮助。