PHP Simple_html_dom问题

时间:2010-05-29 22:54:10

标签: php html-parsing simple-html-dom

下面的代码片段循环浏览一些网页,抓取html,然后查找table.results并从每个网页中包含的标记中获取明文。 $结果还可以。

现在,我正在尝试获取每个第二个中找到的标记的href值。我想在$ results数组中包含它,但我不知道如何做到这一点。第三个foreach语句得到它们,但后来我需要将$ links与$ results合并。理想情况下,我也会在第二个foreach声明中获得链接。

有谁知道怎么做?

$i = 0;
    foreach( $urls as $u )
    {           
        $html = file_get_html($u);

        foreach($html->find('.results tbody tr') as $element)
        {
            $result[$i] = $this->extract($element->plaintext);
            $i++;                   
        }

        foreach($html->find('.results tbody tr a') as $element)
        {
            $links[$i] = $element->href;
            $i++;           
        }                            
    }

    print_r($result); 
    print_r($links); 

    die;

1 个答案:

答案 0 :(得分:0)

$html = file_get_html($u);
foreach($html->find('.results tbody tr') as $element)
{
  $links = $element->find('a');
  foreach($links as $l) {
    $result[] = $l->href;
  }
  $result[] = $this->extract($element->plaintext);
}