Dom文档解析

时间:2017-05-04 10:27:46

标签: php parsing domdocument

我从未使用过dom文档,需要一些帮助 我试图查看其他主题和其他教程,但我无法看到我做错的地方。

这是页面:https://aro.lfv.se/Links/Link/ViewLink?TorLinkId=310&type=MET
这是html的一小部分;

        <h1 class="tor-link-header">&#214;versikt</h1>
            <pre class="linkTextNormal">&#214;VERSIKT F&#214;R OMR&#197;DE E UTF&#196;RDAD 040753
G&#196;LLANDE DEN 4 MAJ 2017 MELLAN 08 OCH 16 UTC


V&#228;der&#246;versikt
Se v&#228;der&#246;versikt f&#246;r omr&#229;de A+B

Sikt under 5 kilometer eller molnbas under 1000 fot
V&#228;ntas inte f&#246;rekomma under perioden.

M&#229;ttlig eller sv&#229;r isbildning
V&#228;ntas inte f&#246;rekomma under perioden

M&#229;ttlig eller sv&#229;r turbulens
08-16UTC: I hela omr&#229;det</pre>
        <h1 class="tor-link-header">Hela Omr&#229;de E</h1>
            <pre class="linkTextNormal">PROGNOS F&#214;R OMR&#197;DE J UTF&#196;RDAD 040753
G&#196;LLANDE DEN 4 MAJ 2017 MELLAN 08 OCH 16 UTC

我发现在整个html中只有两个<pre>标签,这两个标签对我来说都很有趣。

我找到了这段代码(稍微调整一下以适合我的代码),但它不起作用。

$doc = new DOMDocument();
$doc->load( $URL_LHP );

$Parts = $doc->getElementsByTagName( 'pre' );
$Part = $Parts->item(0);
var_dump($Part);

foreach( $Parts as $Part ){
    echo $Part;
}

var_dump返回NULL,echo不返回任何内容。 $ URL_LHP是字符串格式的HTML 如果我回显$ URL_LHP,它将回显网页,但是&#34; dead&#34;图像,没有CSS 所以变量就是我所期望的。

任何人都可以帮我吗?

1 个答案:

答案 0 :(得分:1)

这可能对您有用:

$html = file_get_contents("https://aro.lfv.se/Links/Link/ViewLink?TorLinkId=310&type=MET");
$dom = new DOMDocument();
@$dom->loadHTML($html);
$pres = $dom->getElementsByTagName('pre');

foreach($pres as $pre)
{
    print $pre->nodeValue;
}

<强>输出继电器:

ÖVERSIKT FÖR OMRÅDE E UTFÄRDAD 040753
GÄLLANDE DEN 4 MAJ 2017 MELLAN 08 OCH 16 UTC
...