数据表上的DOM

时间:2013-06-29 13:49:58

标签: php html dom data-extraction

请允许我在代码集之后解释我需要的东西

           <tr>
<td align="center"><a href="search.asp?keyword=1123">1123</a></td>
<td> </td>
<td> </td>
<td> </td>
<td align="center"><a href="member.asp?t_id=75481&amp;t=0"></a> TEXT</td>
          </tr>

我正在尝试CURL的多个行,最后一个t_id = 75481上的链接实际上是ROW号。我想基于第一个

提取它

示例如下

如果首先= NUM​​BER(1123),则检索数字75481(也称为CURL中的CLICK)。

我在这里做的是尝试点击/提交(CURL)包含行号的文本,但我必须根据我的号码与第一个的比较

我在SourceForge中使用PHP Simple HTML DOM Parser.It似乎仅限于我有时可以做的事情,事实上当我用它来提取一些数据时,它似乎无法吸收足够的“条件“这导致我一半时间提取正确的数据,因为不同页面的网站更改(确实如此,取决于内容)

1)我需要一个建议来获取行ID,以便我可以CURL(充当点击) 2)您建议的任何其他HTML DOM?我觉得受限制,或者我只是菜鸟:x

提前感谢!

1 个答案:

答案 0 :(得分:1)

您可以一起使用DOMDocument和XPath来实现您的目标。

$doc = new DOMDocument();
$doc->loadHTMLFile($htmlfile);

$xpath = new DOMXpath($doc);
$elements = $xpath->query("//table/tr/1");