硒页面源与实际页面不匹配

时间:2020-07-20 18:53:10

标签: python selenium twitter

我试图解析推文(比方说https://twitter.com/Tesla),但是遇到一个问题,一旦我使用html = browser.page_source下载源代码,它就与检查元素时看到的不匹配( Ctrl + Shift + I)。它显示了一些推文,但不是全部,但是,当将代码保存到文件中并在Chrome中打开时,我会感到有些困惑。我以前有过使用硒的经验,从未遇到过这样的问题。也许还有其他获取源代码的功能?

顺便说一句,我知道Twitter提供了API,但是即使我不打算对他们的条款做任何事情,他们也拒绝给出我的要求。

1 个答案:

答案 0 :(得分:1)

嘿,这是硒中最糟糕的做法之一

由于多种原因,不建议使用WebDriver登录Gmail和Facebook等网站。除了违反这些网站的使用条款(您可能会面临帐户被关闭的风险)之外,它的运行速度缓慢且不可靠。

理想的做法是使用电子邮件提供商提供的API,或者对于Facebook,使用开发人员工具服务,该服务公开用于创建测试帐户,朋友等的API。尽管使用API​​似乎有些额外的工作,但您会在速度,可靠性和稳定性上得到回报。该API也不太可能更改,而网页和HTML定位器经常更改,并且需要您更新测试框架。

在测试的任何时候使用WebDriver登录到第三方站点都会增加测试失败的风险,因为这会使您的测试时间更长。一般的经验法则是,更长的测试更加脆弱和不可靠。