我正在尝试从外部html页面获取值。
现在这给我带来了魔力:
preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues,PREG_SET_ORDER);
但是在这一行之后我需要循环结果并清理它。
为什么呢?因为我只需要这个(.*?)
,并且由于某种原因它返回还添加额外的</div>
结束标记,所以我需要循环它并在之后清理数组。
我的问题是如何强制只返回这个:(.*?)
?
答案 0 :(得分:0)
摆脱PREG_SET_ORDER
。例如:
<?php
$returnedPage = '<div id="localWeather">test</div><div id="localWeather">test2</div>';
preg_match_all('/id="localWeather">(.*?)<\/div>/',$returnedPage,$returnValues);
print_r($returnValues);
输出:
Array
(
[0] => Array
(
[0] => id="localWeather">test</div>
[1] => id="localWeather">test2</div>
)
[1] => Array
(
[0] => test
[1] => test2
)
)
所以在这种情况下,$returnValues[1]
是一个匹配数组,只有div之间的内容(而不是结束div),而$returnValues[0]
是字符串整个部分的数组与你的正则表达式匹配。
此外,建议不要使用正则表达式来解析HTML。我会查看PHP的DOMDocument课程,它会更强大。