使用css-path从网站获取内容

时间:2014-06-10 11:57:10

标签: php css parsing path file-get-contents

是否可以使用css路径从网站获取内容?

例如

     html 
     body#tplThread 
     div#mainContainer 
     div#main div#possd443.message 
     div.messageInner 
     div.messageContent 
     div.messageContentInner 
     h3#postTops443.messageTitle span

1 个答案:

答案 0 :(得分:1)

不确定

Domdocument是要走的路:

function makeDom( $html_code ) {
$dom = new \DOMDocument();
$dom->LoadHTML($html_code, LIBXML_NONET);
$xpath = new \DOMXPath($this->dom);
return $xpath
}

比使用:

$xpath->query('//div[@id="desiredid"]/a[@href="desiredhref"]')

这是一篇关于Xpath语法的精彩教程: http://www.w3schools.com/xpath/xpath_syntax.asp

如果您要选择的项目具有ID,您甚至不需要完整路径,则选择使用nodename和id就足够了,因为id在整个页面中是唯一的。