Scheme.org有HTML标记,这些标记遵循以下模式:itemscope itemtype=""
和itemprop=""
。
这些标记会插入到其他HTML标记中,例如div
,span
,body
,and others
。
我要做的就是在特定页面中查找这些标签并将它们放在一个数组中。例如:
<div itemscope itemtype="http://scheme.org/Organization">StackOverflow</div>
<span itemprop="name">Stack</span>
在这种情况下,如果找到其中一个标记:itemscope itemtype=""
或itemprop=""
,代码将选择此标记所在的所有绘图,例如:如果在div
内找到该标记,代码将保存所有div
及其中的内容,例如:
'0' = '<div itemscope itemtype="http://scheme.org/Organization">StackOverflow</div>' ,
'1' = '<span itemprop="name">Stack</span>'
到目前为止,我只有这段代码:
$html = file_get_contents('http://stackoverflow.com');
$document = new DOMDocument();
$document->loadHTML($html);
我怎么能这样做?