某些网页可能会通过ajax扩展自身,当您接近底部时,Facebook是一个著名的例子。我对筛选Filmstruck的电影列表页面特别感兴趣。它确实有尽头,但是您可以看到它在向下滚动时添加了电影。有没有一种方法可以使用BeautifulSoup来获取页面上的所有内容?
答案 0 :(得分:0)
没有BeautifulSoup
和requests
或urllib
通常不能在静态网页中使用,这与Facebook每次都加载新数据的Facebook不同。如果您要抓取Facebook之类的动态网站,最好使用selenium
之类的工具加载页面,然后使用BeautifulSoup
或直接通过selenium