Question

我想抓取我的Facebook主页，该主页始终使用python和beautifulsoup登录到我的计算机上。我正在使用以下代码：

from urllib.request import urlopen as urlo
from bs4 import BeautifulSoup as soup
url = 'https://www.facebook.com'
uclient = urlo(url)
page = uclient.read()
uclient.close()
page_soup = soup(page,'html.parser')
x = page_soup.findAll('div',{'id':'fbNotificationsJewel'})

但是x返回一个空列表。我想在显示在Facebook上的通知数量的部门工作，并返回我在我的帐户中拥有的通知数量。我的帐户始终处于登录状态！我做错什么了吗，还是美丽的汤不能做。我将附加一个屏幕快照以显示html代码中的元素，以显示我所指的内容：

enter image description here

Answer 1

当您请求Facebook页面但未通过身份验证时，系统将为您提供标准的登录页面。

我认为该元素在该页面上不存在，因此什么也不返回。

您需要使用漂亮的汤查看身份验证。不幸的是，我无法举一个例子，但是答案在我的帖子里。

为什么我无法通过网页抓取我的Facebook主页？

1 个答案: