Goutte-在遍历各列的同时从td获取链接

时间:2019-01-05 13:24:47

标签: php goutte domcrawler

我正在尝试从表中获取文本和href的混合,最后一列包含href,而其他列仅是文本。迭代时如何获取文本和适当的href。

我有html表,我想从表中创建数组

$html = '<table>
<tr>
    <td>user1</td>
    <td>address1</td>
    <td>dob1</td>
    <td>status1</td>
    <td>link1</td>
</tr>
<tr>
    <td>user2</td>
    <td>address2</td>
    <td>dob2</td>
    <td>status2</td>
    <td>link2</td>
</tr>
<tr>
    <td>user3</td>
    <td>address3</td>
    <td>dob3</td>
    <td>status3</td>
    <td>link3</td>
</tr>
</table>

如您所见,最后一列是一个链接,而其他列是文本,我想提取文本并链接,以便我的数组必须像这样

 array(
      "user1",
      "address1",
      "dob1",
      "status1",
      "<a href='link1'><img src='profile.jpg' /><a/>",
   ),
 array(
      "user2",
      "address2",
      "dob2",
      "status2",
      "<a href='link2'><img src='profile.jpg' /><a/>",
   ),
 array(
      "user3",
      "address3",
      "dob3",
      "status3",
      "<a href='link3'><img src='profile.jpg' /><a/>",
   )
)

我现在可以在下面使用此功能从表格中获取文本

$table = $crawler->filter('table')->filter('tr')->each(function ($tr, $i) {
    return $tr->filter('td')->each(function ($td, $i) {
        return trim($td->text());
    });
});

但是最后一列是链接,我如何使用link()捕获它?

1 个答案:

答案 0 :(得分:0)

可以在第二个循环中按$ i检查吗?因此,如果$ i == 3,则意味着函数应返回link()。