无法获取提取的dom节点值

时间:2011-12-21 20:06:41

标签: php html dom screen-scraping

我有一个代码链接到另一个站点,抓取该数据,并将字符串返回给变量..我想知道为什么这不起作用?

<?php


$file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";
$doc  = new DOMDocument();
@$doc->loadHTMLFile($file);


$elements = $doc->getElementsByTagName('h1');

for ($i=1; $i<=7; $i++)
  {
  echo trim($elements->item($i)->nodeValue);
  }

?>

我想抓住七个“h1”标签,但它们不会回复出来?字符串的一个例子是“这是我试图拔出的测试字符串”

1 个答案:

答案 0 :(得分:0)

这不起作用,因为路径不存在。它指向服务器上的文件。

$file = $DOCUMENT_ROOT . "http://www.sc2brasd.net";

我不确定loadHTMLFile()是否可以处理URL。您可能需要使用file()获取文档并使用DOMDocument :: loadHTML加载它。