使用PHP Simple HTML DOM Parser查找和删除html标记

时间:2013-09-02 12:16:50

标签: php html html-parsing

这是我正在使用的代码

<?php
            include 'simple_html_dom.php';
            $html = file_get_html('index.html');
            echo $html->find('tr', 15);

?>

这将找到表格的第15行。我想要做的是完全删除该行

我已经尝试了

$html->find('tr', 15)=null; 

但似乎无法正常工作

我尝试在http://simplehtmldom.sourceforge.net/manual.htm上查找信息,但在线文档不包含太多信息

3 个答案:

答案 0 :(得分:0)

simple_html_dom似乎不允许删除。

请尝试使用此功能:

$html = new DOMDocument();
$html->loadHTMLFile('index.html');
$element = $html->getElementsByTagName('tr')->item(15);
$element->parentNode->removeChild($element);

答案 1 :(得分:0)

这里有一个工作示例(在Linux中可以正常工作,但很容易适应)。

档案dom_test.php

#!/usr/bin/php
<?php
    $html = new DOMDocument();
    $html->loadHTMLFile('index.html');
    $element = $html->getElementsByTagName('tr')->item(1);
    $element->parentNode->removeChild($element);

    echo $html->saveHTML();
?>

index.html包含的地方:

<html>
    <head></head>
    <body>
        <table>
            <tr><td> hi </td><td>there</td></tr>
            <tr>
                <td> HELLO </td>
                <td> there </td>
            </tr>
            <tr><td> hi </td><td>there</td></tr>
        </table>
    </body>
</html>

将两个文件放在同一目录中并在控制台中执行:

php dom_test.php

输出将显示没有&#34; HELLO那里&#34;行。

我希望能帮助你。

答案 2 :(得分:0)

您可以使用simple_html_dom执行此操作,只需将outertext设置为innertext的值

foreach($html->find('div') as $div) {
    $div->outertext = $div->innertext;
}