Question

我创建了一个脚本，该脚本键入登录名和密码，按“登录”按钮，进入搜索页面，键入搜索并获取结果页面。我需要存储此结果URL，以便可以使用Beautiful汤来提取所需的信息。但是，我无法使用请求库，因为在执行搜索之前我不知道URL。以下是我遇到的问题的示例，我单击了“提交”按钮，这很好，延迟2秒使页面加载。然后，我尝试将结果页存储为变量r，并使用汤来获取所需的信息。

但是，使用下面的代码，我得到了错误的“ str”对象没有属性“ content”，所以我认为这是我的r变量。预先感谢。

O((logn)(E + Vlog(Vlogn)))

Answer 1

假设^{（* 1）} submitbutton.click()和r = browser.page_source是硒调用，“ r”的值是纯字符串-页面的HTML源，位于叫.page_source的那一刻。
这样，它就没有.content属性（您得到了相同的异常），并且您不需要它-您已经有了html，只需将其原样传递给BS的构造函数即可：

soup = bs4.BeautifulSoup(r,'lxml')

^{* 1假定基于问题标记，并且方法/属性名称在下一次更加明确。}

搜索后的Python BeautifulSoup商店URL

1 个答案: