我正在抓取facebook页面数据,但要访问我需要登录我正在使用的帐户的所有数据。
import wget
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"
down = wget.download(url)
f = open(down, 'r')
htmlText = "\n".join(f.readlines())
f.close()
print htmlText
如何登录我的帐户并抓取所有网页数据?
答案 0 :(得分:1)
经过一番调查,我发现Facebook实施了某种CRSF保护,因此简单的urllib3或请求无效。
尝试这样的事情: Login to Facebook using python requests仍使用请求,但使用会话
答案 1 :(得分:0)