标签: php html dom web-scraping
是否可以从通过PHP的DOM工具提取的HTML片段的内容创建HTML输出(例如$ div = $ dom-> getElementsByTagName('table') - > item(0);)这样创建的HTML只包含具有指定标记名称的元素及其后代?
否则,是否有其他方法可以从页面的完整HTML中轻松提取HTML片段?我只想提取我抓取的页面的第一个表格,并只显示该表格及其内容。
答案 0 :(得分:3)
是的,您可以将节点传递给DOMDocument::saveXML()
DOMDocument::saveXML()
echo $dom->saveXml($div);
然后会给你节点