我正在尝试编写一个脚本来获取div标签之间的内容
<div class="bio">
<label>Bio:</label>
<div class="value">[This Is The Content I'm Trying To Get]</div>
</div>
这是我正在尝试从以下位置获取内容的网址:
https://live.xbox.com/en-US/Profile?gamertag=EMT%20PoRsChE
我怎么能这样做?
答案 0 :(得分:2)
您需要使用DOMDocument和DOMXPath
// if the below line does not work, you will need to use CURL or similar.
$theHtmlToParse = file_get_contents('http://url.to/page.html');
$doc = new DOMDocument();
$doc->loadHTMLFile($theHtmlToParse);
$xpath = new DOMXpath($doc);
$elements = $xpath->query("*/div[@class='bio']/div[@class='value']");
// We now have an array of elements, or null
if ($elements !== null)
{
foreach ($elements as $element)
{
echo "<br/>[". $element->nodeName. "]";
$nodes = $element->childNodes;
foreach ($nodes as $node)
{
echo $node->nodeValue. "\n";
}
}
}
这应该足以让你继续:)
答案 1 :(得分:0)
是的,这实际上是可能的。
您可以使用visionmedia/php-selector之类的内容来获取.value的内容 和Guzzle或者一些卷曲来获取之前的来源,如果你还没有。
答案 2 :(得分:0)
好吧,这可以使用file_get_contents()
函数完成。
只需将网页的url
传递到此function
,然后创建object
。
根据需要使用->
浏览对象。