DOMDocument从内联脚本PHP中剥离标记

时间:2014-12-04 09:44:21

标签: javascript php domdocument

这是一个奇怪的但看起来像$ dom-> saveHTML()从内联javascript中剥离标签

$domStr = '
<!DOCTYPE html>
   <html>
    <head>
        <meta charset="utf-8"/>
        <title>my page</title>
        <script>
            var elem = "<div>some content</div>";
        </script>
    </head>
    <body>
        <div>
            MY PAGE
        </div>
    </body>
</html>
';
    $doc = new DOMDocument();
    libxml_use_internal_errors(true);//prevents tags in js from throwing errors; see php.net manual
    $doc->formatOutput = true;
    $doc->strictErrorChecking = false;
    $doc->preserveWhiteSpace  = true;

    $doc->loadHTML($domStr);
    echo $doc->saveHTML();
exit;

http://sandbox.onlinephpfunctions.com/code/ad59a2a1016b2128e437ef61dbe00f1c511bff8d

如果你使用libxml_use_internal_errors(true);你不会看到什么是错的,但如果删除你就会得到

<b>Warning</b>:  DOMDocument::loadHTML(): Unexpected end tag : div

相同
$doc->formatOutput = false;

感谢任何帮助。

2 个答案:

答案 0 :(得分:0)

我通过 not 避免了这种情况,因为我的内联JavaScript中没有包含任何HTML。相反,我添加了<template>元素,其中包含要在JS中操作的HTML字符串,然后在运行时动态读取该字符串。例如:

<!DOCTYPE html>
<html>
    <head>
        <meta charset="utf-8"/>
        <title>my page</title>
    </head>

    <body>
        <div>
            MY PAGE
        </div>

        <template id="content-template">
            <div>some content</div>
        </template>

        <script>
            var elem = document.getElementById('content-template').innerHTML;
            ...
        </script>
    </body>
</html>

答案 1 :(得分:-1)

您在<html>声明后立即错过了开始DOCTYPE代码。