我使用PHP Simple HTML DOM Parser定期从不同网站获取一些信息,使用Chrome的DOM检查器分析如何获取我想要的信息。
特别是一个网站(即TPB)没有适当的HTML代码。因此,Chrome的渲染引擎添加了一些额外的HTML标记来完成标记。我没有意识到这一点,当我的代码没有工作并且没有输出我试图抓取的信息时,我感到困惑。
以下是表格正文的 RAW HTML 代码:
现在,相同的代码,但来自 Chrome的DOM检查器:
我的问题是,是否可以使用Chrome或其他浏览器/扩展程序/工具来检查RAW HTML代码的DOM,而不是浏览器呈现的代码?
使用Chrome浏览器的优秀检查员而不是阅读格式错误且错误的HTML代码,这将使我的网络抓取更容易。如果有更好的方法,请告诉我。
非常感谢你的帮助:)!
答案 0 :(得分:0)
根据评论,答案是 NO ,遗憾的是还没有这样的工具。
但是,我发现了另一种有用的方法,虽然有点单调乏味,但却达到了同样的目的。
代码折叠:
这不是太破旧了,暂时还会工作:)