php抓取并输出具有标签类型h1,p等的所有内容

时间:2017-06-23 22:56:20

标签: php xpath scrape

我接近知道如何做到这一点,但我只知道如何从名为_____的给定h1标签中获取特定内容。我对php很新,所以我不完全确定如何操作它。我想知道的是,如果我能弄明白,是一个随机的网站,如何用ex,一个h1标签来刮取和输出所有内容。

这是我迄今为止能够做到的。它可能只需要一个小的修改。思考?谢谢。

这样可以从< a>标签名为"世界市场"。在不破坏代码的情况下,我能够完全弄清楚的是,如何在<中简单地输出ANYTHING。 a>标签

<?php 

 $doc = new DOMDocument;

// foriegn stocks
 $doc->preserveWhiteSpace = false;


 $doc->strictErrorChecking = false;
  $doc->recover = true;

 $doc->loadHTMLFile('http://www.money.cnn.com/data/markets/');

 $xpath = new DOMXPath($doc);

  $query = "//a[@class='world-market']";

  $entries = $xpath->query($query);
 foreach ($entries as $entry) {
 echo trim($entry->textContent);  // use `trim` to eliminate spaces
 }

 ?>

1 个答案:

答案 0 :(得分:0)

如果您想要给定标签的所有内容,仅仅查询“// a”是不够的?或者“// a / text()”?如果您正在寻找href部分,可以尝试“// a / @ href”。

祝你好运。