用php获取所有Scheme.org html标签?

时间:2016-07-20 19:39:25

标签: php domdocument

Scheme.org有HTML标记,这些标记遵循以下模式:itemscope itemtype=""itemprop=""

这些标记会插入到其他HTML标记中,例如divspanbodyand others

我要做的就是在特定页面中查找这些标签并将它们放在一个数组中。例如:

<div itemscope itemtype="http://scheme.org/Organization">StackOverflow</div>
<span itemprop="name">Stack</span>

在这种情况下,如果找到其中一个标记:itemscope itemtype=""itemprop="",代码将选择此标记所在的所有绘图,例如:如果在div内找到该标记,代码将保存所有div及其中的内容,例如:

 '0' = '<div itemscope itemtype="http://scheme.org/Organization">StackOverflow</div>' ,
 '1' = '<span itemprop="name">Stack</span>'

到目前为止,我只有这段代码:

$html = file_get_contents('http://stackoverflow.com');
$document = new DOMDocument();
$document->loadHTML($html);

我怎么能这样做?

0 个答案:

没有答案