PHP :: Cleaner preg_match_all结果

时间:2015-01-22 18:20:54

标签: php loops foreach preg-match preg-match-all

我正在尝试从外部html页面获取值。

现在这给我带来了魔力:

preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues,PREG_SET_ORDER);

但是在这一行之后我需要循环结果并清理它。

为什么呢?因为我只需要这个(.*?),并且由于某种原因它返回还添加额外的</div>结束标记,所以我需要循环它并在之后清理数组。

我的问题是如何强制只返回这个:(.*?)

1 个答案:

答案 0 :(得分:0)

摆脱PREG_SET_ORDER。例如:

<?php

$returnedPage = '<div id="localWeather">test</div><div id="localWeather">test2</div>';

preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues);

print_r($returnValues);

输出:

Array
(
    [0] => Array
        (
            [0] => id="localWeather">test</div>
            [1] => id="localWeather">test2</div>
        )

    [1] => Array
        (
            [0] => test
            [1] => test2
        )

)

所以在这种情况下,$returnValues[1]是一个匹配数组,只有div之间的内容(而不是结束div),而$returnValues[0]是字符串整个部分的数组与你的正则表达式匹配。

此外,建议不要使用正则表达式来解析HTML。我会查看PHP的DOMDocument课程,它会更强大。