我试图找到一种在没有使用Python的浏览器的情况下自动登录Facebook的方法。我尝试了"请求"库。试过几种方式:
URL = 'http://m.facebook.com'
requests.get(URL, auth = ('email@domain.com', 'mypassword'))
...
form_data = {'email': 'email@domain.com',
'pass' : 'mypassword'
}
requests.post(URL, data = form_data)
...
requests.post(URL + '?email=email@domain.com&pass=mypassword')
最后一种方法填写"电子邮件"页面上的框但是"传递"盒子仍然空着......
有人可以帮帮我吗?是否可以使用请求模拟FB登录?
谢谢!
答案 0 :(得分:23)
您需要发送完整的表格。找出Facebook期望使用Google Chrome's developer tools之类的内容来监控您的网络请求的最简单方法。
为了让您的生活更轻松,我已经在Facebook上监控自己的登录信息,并在下面复制了它(显然有私人信息被编辑),并删除了不重要的信息:
Request URL:https://m.facebook.com/login.php?refsrc=https%3A%2F%2Fm.facebook.com%2F&refid=8
Request Method:POST
Form Data:
lsd:AVqAE5Wf
charset_test:€,´,€,´,水,Д,Є
version:1
ajax:0
width:0
pxr:0
gps:0
m_ts:1392974963
li:cxwHUxatQiaLv1nZEYPp0aTB
email:...
pass:...
login:Log In
如您所见,表单包含很多字段。所有这些都需要提供以允许您登录。您的代码将提供电子邮件和密码。其余的字段实际上是由Facebook为您提供的HTML设置的值。这意味着,要模拟浏览器登录,您需要执行以下步骤:
https://m.facebook.com/
)<input>
元素下方的#login_form
HTML元素中。您需要按名称查找它们(例如charset_test
),然后提取其value
属性。将表单字段的默认值与您的电子邮件和密码相结合,如下所示:
data = {
'lsd': lsd,
'charset_test': csettest,
'version': version,
'ajax': ajax,
'width': width,
'pxr': pxr,
'gps': gps,
'm_ts': mts,
'li': li,
}
data['email'] = email
data['pass'] = pass
data['login'] = 'Log In'
使用请求Session
发送您的登录信息:
s = requests.Session()
r = s.post(url, data=data)
r.raise_for_status()
通过Session
发送您未来的所有HTTP流量。
正如您所看到的,这是一种非常重要的做事方式。这是因为预计程序不会使用该网站登录:相反,您应该使用他们的SDK或他们的web API。
答案 1 :(得分:14)
我也在寻找答案。用requests
做这件事很痛苦。所以,我使用了机械化。
import mechanize
browser = mechanize.Browser()
browser.set_handle_robots(False)
cookies = mechanize.CookieJar()
browser.set_cookiejar(cookies)
browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41 Safari/534.7')]
browser.set_handle_refresh(False)
url = 'http://www.facebook.com/login.php'
self.browser.open(url)
self.browser.select_form(nr = 0) #This is login-password form -> nr = number = 0
self.browser.form['email'] = YourLogin
self.browser.form['pass'] = YourPassw
response = self.browser.submit()
print response.read()
有效。 mechanize.browser
是模拟浏览器,因此您无需发送所有表单值。它会将它们作为普通浏览器发送,您应该只提供登录名和密码。
祝你好运!
答案 2 :(得分:6)
像RoboBrowser这样的库可以让您轻松登录Facebook:
import robobrowser
class Facebook(robobrowser.RoboBrowser):
url = 'https://facebook.com'
def __init__(self, email, password):
self.email = email
self.password = password
super().__init__()
self.login()
def login(self):
self.open(self.url)
login_form = self.get_form(id='login_form')
login_form['email'] = self.email
login_form['pass'] = self.password
self.submit_form(login_form)
答案 3 :(得分:2)
首先,您需要 ALL 表单数据。你不能只发送用户+通行证,服务器将不允许它。
其次,您需要注意并使用从Facebook收到的cookie才能使其正常工作。
但总而言之,是的,您可以使用request
或任何其他图书馆
但我建议改为使用their API。
答案 4 :(得分:2)
这是我的工作代码(2017年5月Python 3.6)。为了使它适合您,只需硬编码您自己的USERNAME,PASSWORD和PROTECTED_URL
# https://gist.github.com/UndergroundLabs/fad38205068ffb904685
# this github example said tokens are also necessary, but I found
# they were not needed
import requests
USERNAME = '-----@yahoo.com'
PASSWORD = '----password'
PROTECTED_URL = 'https://m.facebook.com/groups/318395378171876?view=members'
# my original intentions were to scrape data from the group page
# PROTECTED_URL = 'https://www.facebook.com/groups/318395378171876/members/'
# but the only working login code I found needs to use m.facebook URLs
# which can be found by logging into https://m.facebook.com/login/ and
# going to the the protected page the same way you would on a desktop
def login(session, email, password):
'''
Attempt to login to Facebook. Returns cookies given to a user
after they successfully log in.
'''
# Attempt to login to Facebook
response = session.post('https://m.facebook.com/login.php', data={
'email': email,
'pass': password
}, allow_redirects=False)
assert response.status_code == 302
assert 'c_user' in response.cookies
return response.cookies
if __name__ == "__main__":
session = requests.session()
cookies = login(session, USERNAME, PASSWORD)
response = session.get(PROTECTED_URL, cookies=cookies,
allow_redirects=False)
assert response.text.find('Home') != -1
# to visually see if you got into the protected page, I recomend copying
# the value of response.text, pasting it in the HTML input field of
# http://codebeautify.org/htmlviewer/ and hitting the run button
答案 5 :(得分:1)
我可以说在不使用他们的API的情况下登录Facebook非常烦人。他们也喜欢改变一切,因此维护代码非常重要。
我之前做过这个,但我不认为我的代码能够适应当前的Facebook。但它应该是一个有用的起点:
https://gitorious.org/blogsmashonfb/blogsmashonfb/source/4f7ee94a56fdffe9392485df8999e340f97f4bbe:
它有两个部分,一个webcrawler和一个Facebook处理程序(后者是你感兴趣的)。
您的代码中存在的一个主要问题是您必须首先访问Facebook,因为他们会向您发送一个包含您需要发回的隐藏元素的登录表单。
答案 6 :(得分:1)
正如其他人所说的使用请求是一种痛苦。你可以用硒来做到这一点。通过访问他们的网站安装selenium或只是使用pip来安装它。
pip install -U selenium
我写了下面的代码。我自己试了一下它的确有效。
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
binary = FirefoxBinary(r'C:\Program Files (x86)\Mozilla Firefox\firefox.exe')
driver = webdriver.Firefox(firefox_binary=binary)
driver.get('https://www.facebook.com/')
username= "your_username"
password = "your_password"
UN = driver.find_element_by_id('email')
UN.send_keys(username)
PS = driver.find_element_by_id('pass')
PS.send_keys(password)
LI = driver.find_element_by_id('loginbutton')
LI.click()
答案 7 :(得分:1)
这是有效的(2017年4月)
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import argparse
import datetime
import json
import logging
import re
import random
import requests
import shutil
from pyquery import PyQuery as pq
def main(username, password):
logging.basicConfig(filename='imgur2fb.log', level=logging.DEBUG)
session = requests.session()
uid, dtsg = login(session, username, password)
def login(session, username, password):
'''
Login to Facebook
'''
# Navigate to the Facebook homepage
response = session.get('https://facebook.com')
# Construct the DOM
dom = pq(response.text)
# Get the lsd value from the HTML. This is required to make the login request
lsd = dom('[name="lsd"]').val()
# Perform the login request
response = session.post('https://www.facebook.com/login.php?login_attempt=1', data={
'lsd': lsd,
'email': username,
'pass': password,
'default_persistent': '0',
'timezone': '-60',
'lgndim': '',
'lgnrnd': '',
'lgnjs': '',
'locale':'en_GB',
'qsstamp': ''
})
'''
Get the users ID and fb_dtsg token. The fb_dtsg token is required when making requests as a logged in user. It
never changes, so we only need to grab this token once.
If the login was successful a cookie 'c_user' is set by Facebook. If the login failed, the 'c_user' cookie
will not be present. This will raise an exception.
'''
try:
uid = session.cookies['c_user']
dtsg = re.search(r'(type="hidden" name="fb_dtsg" value="([0-9a-zA-Z-_:]+)")', response.text).group(1)
dtsg = dtsg[dtsg.find("value")+6:]
dtsg = dtsg[1:-1]
except KeyError:
raise Exception('Login Failed!')
return uid, dtsg
try:
main(username='*****', password='*****')
except Exception, e:
logging.exception(e)
print e
答案 8 :(得分:0)
首先,您需要知道要发布的数据。关注this link。
获得所有必需数据后,代码很简单,如下所示:
import requests, bs4`
s = requests.Session()
url = 'https://www.facebook.com/login'
res = s.get(url)
form_data = {
# Copy paste the form data here as a valid python dict
}
s.post(url, data=form_data)
# Now try accessing your profile from sessions object
这对我有用。