Question

我正在抓取facebook页面数据，但要访问我需要登录我正在使用的帐户的所有数据。

import wget
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"

down = wget.download(url)

f = open(down, 'r')
htmlText = "\n".join(f.readlines())
f.close()
print htmlText

如何登录我的帐户并抓取所有网页数据？

Answer 1

经过一番调查，我发现Facebook实施了某种CRSF保护，因此简单的urllib3或请求无效。

尝试这样的事情： Login to Facebook using python requests仍使用请求，但使用会话

Answer 2

对于python3，您可以使用urllib library。

以下是使用它登录网站的人的示例。

How to use urllib in python 3?

facebook页面抓取需要登录

2 个答案: