我正在尝试抓取一个页面来获取网络分析的数据。我在一个电子商务网站上做过虚拟购买。页面上有一个事务ID,但是围绕它的html不适合抓取,id存在于未分类的标记中,没有父级或父级父级的类,ID或其他有用属性。
所以,我想查看来源和ctrl + F的交易ID“123456”,看看它是否存在于dom的其他任何地方。
但是,当我查看源代码时,我会收到“确认表单提交”页面,并且无法查看页面后面的html。
添加Javascript标记,以防在这些变量中的任何地方搜索“123456”值的所有全局变量的神奇方法?如果我在全局变量对象中找到了电子商务数据,那么抓取HTML就会非常方便,在这种情况下,HTML几乎没有什么属性可以深入研究
答案 0 :(得分:0)
您可以将整个页面保存为HTML文件。在Chrome中,您只需按 Ctrl + S ,选择目的地,然后在某个文本编辑器中编辑保存的文件。