给定的网址包含代码: -
<meta itemprop="price" content="12.00" />
我想将12提取到一个新变量,我不知道从哪里开始,因为在这里我们不能使用用于提取普通元标记的标签PHP函数!
答案 0 :(得分:1)
为了获取所有元标记,您应该使用XPath来选择所有节点
$xmlsource = 'http://www.example.com/';
$d = new DOMDocument();
$d->loadHTML($xmlsource);
$xpath = new DOMXPath($d);
//find all elements with itemprop attribute
$nodes = $xpath->query('//*[@itemprop]');
foreach ($nodes as $node) {
}
答案 1 :(得分:1)
您还可以使用DOMDocument::getElementsByTagName:
$string = file_get_contents('http://www.example.com/');
$dom = new DOMDocument();
$dom->loadHTML($string);
$dom->preserveWhiteSpace = false;
//get all meta tags
$el = $dom->getElementsByTagName('meta');
echo'<pre>';
print_r($el);
echo'</pre>';
foreach($el as $val){
//get value of each content
echo $val -> getAttribute('content').'<br>';
}
答案 2 :(得分:0)
XPath过滤器为 // meta [@ itemprop ='price'] / @ content
如果您在Google表格中,则可以按以下方式使用importXML公式。...
= importxml(“ http://www.example.com/product-specific-url-here”,“ // meta [@ itemprop ='price'] / @ content”)
您正在寻找什么吗?