用于屏幕抓取网站的PHP Regex或Dom解决方案

时间:2014-08-06 18:54:27

标签: php regex dom screen-scraping

我有一个页面,我需要从中提取数据,其格式为我需要的部分:

<td style="font-weight:bold;">Business Information</td><td id="BusInfo" colspan="2">Some Company<br /><br />Business Phone Number: (111) 111-1111<br /><br />111 Some STREET<br />Some City, AA 11111<br /></td>

我可以获得除街道以外的所有数据。 Dom将所有换行符放入一个数组元素和我的正则表达式:

$comregex = '/<br \/><br \/>(.*?)<br \/>/';

只拉电话号码。 有什么建议吗?

1 个答案:

答案 0 :(得分:0)

这很有效,它为我打破了每个阵列,并且能够拉出街道地址。

$comregex = '/(.*?)br \/>(.*?)<br \/(.*?)/';