facebook页面抓取需要登录

时间:2015-06-16 18:34:05

标签: python

我正在抓取facebook页面数据,但要访问我需要登录我正在使用的帐户的所有数据。

import wget
from bs4 import BeautifulSoup
url = "https://www.facebook.com/hellomeets/events"

down = wget.download(url)

f = open(down, 'r')
htmlText = "\n".join(f.readlines())
f.close()
print htmlText

如何登录我的帐户并抓取所有网页数据?

2 个答案:

答案 0 :(得分:1)

经过一番调查,我发现Facebook实施了某种CRSF保护,因此简单的urllib3或请求无效。

尝试这样的事情: Login to Facebook using python requests仍使用请求,但使用会话

答案 1 :(得分:0)

对于python3,您可以使用urllib library

以下是使用它登录网站的人的示例。

How to use urllib in python 3?

相关问题