使用PHP进行刮擦

时间:2015-02-05 17:27:20

标签: php regex web-scraping html-parsing

我正在尝试获得一个值,但是要跳过其他动态变化的值。

表格部分如下所示:

Total      1.18     3.33    $20,000     16.2%

我用来查找preg_match中第三个值的代码是:

<?php
function get_total(){
$file_string = file_get_contents('url');
preg_match('#Total</td><td>\d\.\d+</td><td>d\.\d+</td><td>$(\d+)</td><td>d+\.\d\%\</td></tr></table><br><span id="ExStockDetailTableF1F2"#',$file_string, $data);

$loss = $data[1];
return $loss;
}
?>

1 个答案:

答案 0 :(得分:0)

自代表第三组以来,仅仅搜索\$[\d\,]+会不会更容易?