无法让preg_match用于网页抓取

时间:2012-12-26 15:39:55

标签: php html regex web-scraping

我这里有一些代码,但是我无法让它工作。有人能帮助我吗?

$file_string = file_get_contents('URL');
$search = "<tr><th> <a href=''>Data_name</a></th><td>(.*)</td></tr>";
preg_match($search, $file_string, $title);
$title_out = $title[1];
echo $title_out;

1 个答案:

答案 0 :(得分:0)

看看@Touki所说的内容 - 但这可能会帮助您解决未来可能出现的任何正则表达式问题:

  1. 您可能没有看到第一行以外的任何内容。您想使用“multiline

  2. <tr><th> <a href=''>Data_name</a></th><td>(.*)</td></tr>似乎看起来非常精确的字符串。确保您的空白区域正确(标签,空格,换行等)。你似乎也错过了一个超链接,不确定这是否是故意的。