python - 使用BeautifulSoup刮取网站，使用不变的URL

使用beautifulsoup确实无法直接实现这一点，因为beautifulsoup处理静态网页。您要抓取的内容将通过JavaScript添加到页面中，而不是添加到HTML中。

按钮＆＃39;更多电影＆＃39;调用一个javascript函数，可能会有一些AJAX函数调用更多的电影。

在某些情况下，您可以访问更多电影＆＃39;容易：

然而，对于rottentomatoes来说，上述情况似乎都不是。我快速看了一下，也许你应该更彻底地调查它。

我过去使用的解决方案是：Selenium。它有一个易于使用的python库，允许您自动化浏览器行为。这样你就可以自动地＃39;在抓取时点击加载更多按钮。

小心但是，这可能会很慢并且耗费资源。你可以无头地运行它，这使它无法打开浏览器并节省一些资源。