我试图在某个网页的正文中阅读以显示在单独的网页上,但我遇到了一些麻烦。现在,我使用以下代码
<?php
@$doc = new DOMDocument();
@$doc->loadHTMLFile('http://foo.com');
@$tags = $doc->getElementsByTagName('body');
foreach ($tags as $tag) {
$index_text .= $tag->nodeValue;
print nl2br($tag->nodeValue).'<br />';
}
?>
此代码有效,但它似乎删除了很多格式,这对我来说很重要,例如换行符。如何阻止这种情况发生
答案 0 :(得分:7)
DOMDocument的formatOutput
属性将执行此操作。
$doc->formatOutput = true;
这将导致DOM输出更多地输出供人类消费,在你需要它们的时候换行和缩进,即'漂亮的打印'。
此值的默认值为false
,因此您必须在需要时将其明确设置为true
。