如何从php中的网页获取链接

时间:2012-08-26 07:18:12

标签: php

我有以下链接列表。

<tr><td><a href="javascript:d(43755)"> Microsoft office 2010 professional plus </a></td><td> 2012-04-09 </td><td align="right"> 28% </td></tr>
<tr><td><a href="javascript:d(43742)"> Microsoft Office 2010 all versions </a></td><td> 2010-11-03 </td><td align="right"> 63% </td></tr>
<tr><td><a href="javascript:d(43747)"> Microsoft Office 2010 Home and student </a></td><td> 2012-05-10 </td><td align="right"> 51% </td></tr>

有没有办法获取链接中的所有数字javascript:数组中的d(数字)和另一个数组中的日期?

3 个答案:

答案 0 :(得分:3)

我会使用DOM解析器。如果您熟悉CuRL,可以用很少的代码完成。您可以解析整个页面并查找所有链接,并从中获取所需的任何信息。

以下是CuRL的优秀指南:curl tutorial

答案 1 :(得分:2)

$input = '<tr>...........YOU PAGE HERE';
$result = array(); // your result array
preg_match_all('/d\((\d+)\).*?(\d{4}-\d{2}-\d{2})/', $input, $result, PREG_PATTERN_ORDER);
$numbers = $result[1]; // your numbers
$dates = $reult[2]; // your dates

答案 2 :(得分:0)

我推荐这个小图书馆Simple HTML DOM Parser