Selenium python:如何在加载头/标题时停止页面加载?

时间:2017-10-15 02:04:24

标签: python css selenium web-scraping

想要一个擦除URL列表标题的脚本,但如果我们需要等到整个页面加载,它可能会超级慢。标题是我唯一要找的东西。

标题加载后我们可以停止加载页面吗?也许像EC.title_contains。

2 个答案:

答案 0 :(得分:0)

您是否尝试过在selenium功能中设置 pageLoadStrategy

您可以在此主题中了解更多相关信息 - Page load strategy for Chrome driver

http://webdriver.io/guide/getstarted/configuration.html - 有点过时,表示它仅适用于Firefox,但现在应该适用于所有浏览器。

答案 1 :(得分:0)

问题是webdriver.io作为示例等待页面完全加载并且选项卡中的加载计时器消失。这是有充分理由的,因为很多API如.getText在加载完整页面之前不起作用,因为有时元素只会在最后作为示例加载。 但您可以通过以下方式减少加载时间:

1。您使用脚本安全或其他简单脚本拦截器之类的扩展程序,可以使用内联或外部javascript来阻止所有内容。

2。转到Chrome设置并禁用Cookie,javascript,flash等所有内容。

3。转到 chrome:// flags 并禁用从javascript(所有API类似游戏手柄API ETC)到WebGL,Canvas等的所有内容。 - 您可以真正禁用所有我还有一个chrome配置文件,我禁用了所有内容。

现在拥有正常的互联网速度和良好的CPU,您可以在1-3秒内打开每个站点。

或者您也可以选择无头浏览器。