Question

我正在尝试编写一个脚本来获取div标签之间的内容

<div class="bio">

    <label>Bio:</label>

    <div class="value">[This Is The Content I'm Trying To Get]</div>

</div>

这是我正在尝试从以下位置获取内容的网址：

https://live.xbox.com/en-US/Profile?gamertag=EMT%20PoRsChE

我怎么能这样做？

Answer 1

您需要使用DOMDocument和DOMXPath

// if the below line does not work, you will need to use CURL or similar.
$theHtmlToParse = file_get_contents('http://url.to/page.html');
$doc = new DOMDocument();
$doc->loadHTMLFile($theHtmlToParse);
$xpath = new DOMXpath($doc);
$elements = $xpath->query("*/div[@class='bio']/div[@class='value']");
// We now have an array of elements, or null
if ($elements !== null)
{
    foreach ($elements as $element)
    {
        echo "<br/>[". $element->nodeName. "]";

        $nodes = $element->childNodes;
        foreach ($nodes as $node)
        {
          echo $node->nodeValue. "\n";
        }
    }
}

这应该足以让你继续：）

Answer 2

是的，这实际上是可能的。

您可以使用visionmedia/php-selector之类的内容来获取.value的内容和Guzzle或者一些卷曲来获取之前的来源，如果你还没有。

Answer 3

好吧，这可以使用file_get_contents()函数完成。只需将网页的url传递到此function，然后创建object。根据需要使用->浏览对象。

PHP - 从外部URL获取内容

3 个答案: