使用PHP的DOM提取Scraped页面的HTML

时间:2010-10-26 17:39:55

标签: php html dom web-scraping

是否可以从通过PHP的DOM工具提取的HTML片段的内容创建HTML输出(例如$ div = $ dom-> getElementsByTagName('table') - > item(0);)这样创建的HTML只包含具有指定标记名称的元素及其后代?

否则,是否有其他方法可以从页面的完整HTML中轻松提取HTML片段?我只想提取我抓取的页面的第一个表格,并只显示该表格及其内容。

1 个答案:

答案 0 :(得分:3)

是的,您可以将节点传递给DOMDocument::saveXML()

echo $dom->saveXml($div);

然后会给你节点

的outerHTML