我创建了一个脚本,该脚本键入登录名和密码,按“登录”按钮,进入搜索页面,键入搜索并获取结果页面。 我需要存储此结果URL,以便可以使用Beautiful汤来提取所需的信息。但是,我无法使用请求库,因为在执行搜索之前我不知道URL。 以下是我遇到的问题的示例,我单击了“提交”按钮,这很好,延迟2秒使页面加载。然后,我尝试将结果页存储为变量r,并使用汤来获取所需的信息。
但是,使用下面的代码,我得到了错误的“ str”对象没有属性“ content”,所以我认为这是我的r变量。预先感谢。
O((logn)(E + Vlog(Vlogn)))
答案 0 :(得分:-1)
假设(* 1) submitbutton.click()
和r = browser.page_source
是硒调用,“ r”的值是纯字符串-页面的HTML源,位于叫.page_source
的那一刻。
这样,它就没有.content
属性(您得到了相同的异常),并且您不需要它-您已经有了html,只需将其原样传递给BS的构造函数即可:>
soup = bs4.BeautifulSoup(r,'lxml')
* 1假定基于问题标记,并且方法/属性名称在下一次更加明确。