DomCrawler选择表格

时间:2015-12-30 14:51:46

标签: symfony xpath domcrawler

我有一个网页,我正在抓取表单字段(或至少尝试)。我使用Symfony2(和Goutte)来执行此操作,因此我有一个$crawler对象。以下是html的示例:

<html>
<body> 
... other html stuff ...
<form method="post" action="goSomewhere">
<table>
    <tr><td><input type="checkbox" name="123">Stuff 1</td></tr>
    <tr><td><input type="checkbox" checked name="456">Stuff 2</td></tr>
    <tr><td><input type="checkbox" name="789">Stuff 3</td></tr>
</body> 
</html>

正如您所看到的,有很多嵌套内容。我的兴趣只是<input>代码中的<form></form>代码。

我尝试过这样的事情:

$query = "//form/input";
$inputs = $crawler->filterXPath($query);

但它似乎并没有得到所有(并且只有)输入标签。我做了一个->count(),当数量超过50-100个输入标签时,我只得到8个数字。

任何人都可以帮我解决这个问题吗?

此外,一旦我有了这个,我就有兴趣删除特定的输入。 Dom Crawler中有一种方法可以让我这样做吗?我环顾了很多地方并且找不到多少。也许如果我做倒置过滤系统?

感谢您的帮助!

0 个答案:

没有答案