使用cURL和simpleXMLElement来提取数据。如何在XPATH之后获取XML元素的值?

时间:2011-12-11 18:58:25

标签: php html curl xpath simplexml

我在从SimpleXMLElement对象中提取我想要的数据时遇到了一些问题。以下是我正在使用的代码的基础知识:

curl_setopt( $ch, CURLOPT_URL, $URL );
$html = curl_exec( $ch );
$html = $tidy->parseString( $html, $tc, 'utf8' );
$tidy->cleanRepair();
$html = $tidy->body()->value;
$xml = new SimpleXMLElement( $html );

$xml = $xml->xpath( "//ul[@id='wxoptions']/li[3]/a" ); //Your XPATH

print_r( $xml );

导航到我想要的正确HTML元素,但打印:

Array
(
    [0] => SimpleXMLElement Object
        (
            [@attributes] => Array
                (
                    [href] => http://www.mylink.com
                    [title] => mylink
                )

            [0] => mylink
        )

)

我需要的值是该数组中的[href],“http://www.mylink.com”。如何从我包含的输出中提取它?我很难接受SimpleXMLElement和Xpath。

1 个答案:

答案 0 :(得分:0)

使用iterate和attributes

foreach ( $xml->xpath( "//ul[@id='wxoptions']/li[3]/a" ) as $node)
{
  $href = $node->attributes("href");
}

或者直接打电话:

$href = $xml[0]->attributes("href");