python - 有没有办法将BeautifulSoup与诸如Facebook之类的自扩展页面一起使用？

有没有办法将BeautifulSoup与诸如Facebook之类的自扩展页面一起使用？

时间：2018-08-24 15:23:06

标签： python ajax beautifulsoup screen-scraping

某些网页可能会通过ajax扩展自身，当您接近底部时，Facebook是一个著名的例子。我对筛选Filmstruck的电影列表页面特别感兴趣。它确实有尽头，但是您可以看到它在向下滚动时添加了电影。有没有一种方法可以使用BeautifulSoup来获取页面上的所有内容？

https://www.filmstruck.com/us/watch/browse-all/

1 个答案:

答案 0 :(得分：0)

没有BeautifulSoup和requests或urllib通常不能在静态网页中使用，这与Facebook每次都加载新数据的Facebook不同。如果您要抓取Facebook之类的动态网站，最好使用selenium之类的工具加载页面，然后使用BeautifulSoup或直接通过selenium

访问

有没有办法抓取所有Facebook粉丝页面？
有没有办法从Facebook检索前50页？
有没有办法在Facebook Like Box小部件中删除像计数？
有没有办法在Facebook上自动提问？用RFID看它
有没有办法使用presentShareDialogWithPhotoParams与初始文本？
有没有办法实时存储/更新Facebook api＆＃39;分享＆＃39;喜欢＆＃39;将网站上的每个页面计入数据库？
有没有办法使用多个相同的属性，如nextSibling？
有没有办法将无人机与自签名证书一起使用？
有没有办法让人们的Facebook喜欢页面？
有没有办法将BeautifulSoup与诸如Facebook之类的自扩展页面一起使用？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？