我尝试在div上返回一个数字,我想要“01 55 33 44”
<div data-phone="01 55 33 44" class="agency_phone ">
Phone
</div>
我试过了:
$url = "myurl";
$raw = file_get_contents($url);
preg_match('/<div data-phone="(.*)"class="agency_phone "/isU',$raw,$output);
echo $output[1];
我没有回头, somone有个主意吗?
提前致谢。
答案 0 :(得分:1)
首先,你的正则表达式要求在属性后面只有零空格,因此它与你的实际HTML只有一个空格不匹配:
Entities
在任何情况下,使用正则表达式从头开始编写一个像样的HTML解析器是非常困难的。最简单的方法是DOM和XPATH,例如:
/<div data-phone="(.*)"class="agency_phone "
<div data-phone="01 55 33 44" class="agency_phone ">
<?php
$html = '
<div data-phone="01 55 33 44" class="agency_phone ">
Phone
</div>
<p>Unrelated</p>
<div>Still unrealted</div>
<div data-phone="+34 947 854 712" class="agency_phone ">
Phone
</div>
';
$dom= new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$phones = $xpath->query('//div/@data-phone');
foreach ($phones as $phone) {
var_dump($phone->value);
}
答案 1 :(得分:0)
是否缺少空间?
[编辑] 将完整文件放在此处用于复制目的 [/编辑]
这有效:
// file url.html
<div data-phone="01 55 33 44" class="agency_phone ">
Phone
</div>
和
<?php
// file test.php
$raw = file_get_contents('url.html');
preg_match('/data-phone="(.*)" class/',$raw,$output);
echo $output[1]; // 01 55 33 44
答案 2 :(得分:0)
index.php
文件包含以下内容。
<?php
$url = "test.php";
echo $raw = file_get_contents($url);
preg_match('/data-phone="(.*)" class/', $raw, $output);
echo $output[1];
?>
以及其他具有html标记的文件source.php
。
<div data-phone="01 55 33 44" class="agency_phone ">
Phone
</div>
它将返回followig数组
Array
(
[0] => data-phone="01 55 33 44" class
[1] => 01 55 33 44
)
答案 3 :(得分:0)
在本地主机上使用html文件进行测试,似乎工作正常。
<?php
$url = "myurl";
$subject = file_get_contents($url);
$pattern='<div data-phone="(.*)" class="agency_phone ">';
preg_match($pattern, $subject, $output);
echo $output[1];
?>