为什么我无法通过网页抓取我的Facebook主页?

时间:2019-03-09 17:00:29

标签: python web-scraping beautifulsoup

我想抓取我的Facebook主页,该主页始终使用python和beautifulsoup登录到我的计算机上。我正在使用以下代码:

from urllib.request import urlopen as urlo
from bs4 import BeautifulSoup as soup
url = 'https://www.facebook.com'
uclient = urlo(url)
page = uclient.read()
uclient.close()
page_soup = soup(page,'html.parser')
x = page_soup.findAll('div',{'id':'fbNotificationsJewel'})

但是x返回一个空列表。我想在显示在Facebook上的通知数量的部门工作,并返回我在我的帐户中拥有的通知数量。我的帐户始终处于登录状态!我做错什么了吗,还是美丽的汤不能做。我将附加一个屏幕快照以显示html代码中的元素,以显示我所指的内容:

enter image description here

1 个答案:

答案 0 :(得分:0)

当您请求Facebook页面但未通过身份验证时,系统将为您提供标准的登录页面。

我认为该元素在该页面上不存在,因此什么也不返回。

您需要使用漂亮的汤查看身份验证。不幸的是,我无法举一个例子,但是答案在我的帖子里。