我有一个网页,我正在抓取表单字段(或至少尝试)。我使用Symfony2
(和Goutte
)来执行此操作,因此我有一个$crawler
对象。以下是html的示例:
<html>
<body>
... other html stuff ...
<form method="post" action="goSomewhere">
<table>
<tr><td><input type="checkbox" name="123">Stuff 1</td></tr>
<tr><td><input type="checkbox" checked name="456">Stuff 2</td></tr>
<tr><td><input type="checkbox" name="789">Stuff 3</td></tr>
</body>
</html>
正如您所看到的,有很多嵌套内容。我的兴趣只是<input>
代码中的<form></form>
代码。
我尝试过这样的事情:
$query = "//form/input";
$inputs = $crawler->filterXPath($query);
但它似乎并没有得到所有(并且只有)输入标签。我做了一个->count()
,当数量超过50-100个输入标签时,我只得到8个数字。
任何人都可以帮我解决这个问题吗?
此外,一旦我有了这个,我就有兴趣删除特定的输入。 Dom Crawler
中有一种方法可以让我这样做吗?我环顾了很多地方并且找不到多少。也许如果我做倒置过滤系统?
感谢您的帮助!