文件获取内容+ preg匹配

时间:2016-06-14 10:39:23

标签: php html class file-get-contents

我尝试在div上返回一个数字,我想要“01 55 33 44”

     <div data-phone="01 55 33 44" class="agency_phone ">
     Phone
     </div>

我试过了:

   $url = "myurl"; 
    $raw = file_get_contents($url); 
    preg_match('/<div data-phone="(.*)"class="agency_phone "/isU',$raw,$output); 
    echo $output[1];  

我没有回头, somone有个主意吗?

提前致谢。

4 个答案:

答案 0 :(得分:1)

首先,你的正则表达式要求在属性后面只有零空格,因此它与你的实际HTML只有一个空格不匹配:

Entities

在任何情况下,使用正则表达式从头开始编写一个像样的HTML解析器是非常困难的。最简单的方法是DOM和XPATH,例如:

/<div data-phone="(.*)"class="agency_phone "
<div data-phone="01 55 33 44" class="agency_phone ">
<?php

$html = '
    <div data-phone="01 55 33 44" class="agency_phone ">
     Phone
     </div>
     <p>Unrelated</p>
     <div>Still unrealted</div>
        <div data-phone="+34 947 854 712" class="agency_phone ">
          Phone
          </div>

';

$dom= new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$phones = $xpath->query('//div/@data-phone');
foreach ($phones as $phone) {
    var_dump($phone->value);
}

答案 1 :(得分:0)

是否缺少空间?

[编辑] 将完整文件放在此处用于复制目的 [/编辑]

这有效:

// file url.html
<div data-phone="01 55 33 44" class="agency_phone ">
     Phone
     </div>

<?php
// file test.php
$raw = file_get_contents('url.html');
preg_match('/data-phone="(.*)" class/',$raw,$output);
echo $output[1]; // 01 55 33 44

答案 2 :(得分:0)

index.php文件包含以下内容。

<?php
   $url = "test.php"; 
   echo $raw = file_get_contents($url); 
   preg_match('/data-phone="(.*)" class/', $raw, $output);
   echo $output[1];
?>

以及其他具有html标记的文件source.php

<div data-phone="01 55 33 44" class="agency_phone ">
  Phone
</div>

它将返回followig数组

Array
(
  [0] => data-phone="01 55 33 44" class
  [1] => 01 55 33 44
)

答案 3 :(得分:0)

在本地主机上使用html文件进行测试,似乎工作正常。

<?php
$url = "myurl"; 
$subject = file_get_contents($url); 
$pattern='<div data-phone="(.*)" class="agency_phone ">';
preg_match($pattern, $subject, $output);
echo $output[1];    
?>