如果我在C#(或类似)中使用WebClient类来请求网页,是否有办法确定所请求页面的请求,即CSS,JS或图像文件?
目前我使用WebClient获取原始HTML,然后使用HtmlAgilityPack解析图像,样式和javascript文件。
然而,这不会捕获客户端的任何请求,这些请求可能在返回的html中不可见。
有没有办法确定页面使用WebBrowser控件或类似命令请求哪些请求?
答案 0 :(得分:0)
仅通过页面返回的HTML进行解析只会让您获得部分图片。真正确定页面将发出何种请求的唯一方法是呈现页面。您可以使用PhantomJS等PhantomJS wrapper for .NET (C#)等工具执行此操作。