使用IE的Python BrowserMob代理捕获不正确的HAR?

时间:2016-07-01 17:11:02

标签: python internet-explorer selenium browsermob-proxy

我目前正在尝试使用BrowserMob Proxy(v2.1.1)+ Selenium(v2.5.3)进行Python(v2.6)来测试页面加载时间并将它们输出到HAR文件。我需要测试Chrome和IE。我目前已经完全适用于Chrome,它在IE上运行没有错误,但它没有捕获到HAR文件的正确数据。

这张图片是我得到的两个不同HAR文件的比较。第一个是IE的结果,第二个是Chrome的结果。我需要为两者做同样的事情。我有一种感觉,我在设置代理的方式上做错了,但根据http://www.seleniumhq.org/docs/04_webdriver_advanced.jsp,对于Chrome / IE来说它应该和我一样基本相同。我的想法是,它没有使用正确的代理端口或其他东西,但我不知道如何解决它

enter image description here

正如您所看到的,它似乎也捕获了selenium正在页面上做什么,这不是我想要的。这是我正在使用的代码:

class SeleniumObject:

    def __init__(self):
        # Start up the server
        self.server = Server(Config.BAT_PATH) #resolves to the location of browsermob-proxy-2.1.1/bin/browsermob-proxy.bat
        self.server.start()
        self.proxy = self.server.create_proxy()

    def setupDriver(self, browser):
        self.browser = browser.lower()
        PROXY = self.proxy.proxy

        # Chrome
        if self.browser == 'chrome':
            options = webdriver.ChromeOptions()
            options.add_argument("--start-maximized")
            desired_capabilities = webdriver.DesiredCapabilities.CHROME.copy()
            # Change the proxy properties of that copy.
            desired_capabilities['proxy'] = {
                "httpProxy":PROXY,
                "ftpProxy":PROXY,
                "sslProxy":PROXY,
                "noProxy":None,
                "proxyType":"MANUAL",
                "class":"org.openqa.selenium.Proxy",
                "autodetect":False
            }
            self.driver = webdriver.Chrome(chrome_options=options, desired_capabilities=desired_capabilities)

        # IE 
        if self.browser == 'ie':
            desired_capabilities = webdriver.DesiredCapabilities.HTMLUNITWITHJS.copy()
            desired_capabilities['proxy'] = {
                "httpProxy":PROXY,
                "ftpProxy":PROXY,
                "sslProxy":PROXY,
                "noProxy":None,
                "proxyType":"MANUAL",
                "class":"org.openqa.selenium.Proxy",
                "autodetect":False
            }
            self.driver = webdriver.Ie(capabilities=desired_capabilities) 

    def outputHAR(self):
            # Output the data as a HAR file
            self.har_json = json.dumps(self.proxy.har, indent=4, sort_keys=True)  # returns a HAR JSON blob
            open(self.browser + '-load-summary-' + self.sample_time + '.har', 'w').write(self.har_json)

    def setSampleTime(self):
        self.sample_time = datetime.now().strftime("%Y-%m-%d_%H-%M-%S")

    def shutDown(self):
        self.setRegKey("ProxyEnable", 0)  # Forces the internet setting to stop using the proxy in case there was an error
        self.driver.quit()
        self.proxy.close()
        self.server.stop()

selenium = SeleniumObject()
selenium.setupDriver("chrome")
selenium.setSampleTime()
selenium.proxy.new_har("W3Schools")
selenium.driver.get("http://www.w3schools.com")
selenium.outputHAR()
selenium.shutDown()
print "Done!"

1 个答案:

答案 0 :(得分:1)

在启动浏览器之前,您需要确保IE的缓存是干净的:

desired_capabilities  = webdriver.DesiredCapabilities.INTERNETEXPLORER
desired_capabilities ["ie.ensureCleanSession"] = True
driver = webdriver.Ie(capabilities=desired_capabilities )

请注意,您正在阅读代理上的指标。因此,您只测量每个请求的响应时间,而不是页面加载时间。