使用python请求登录Facebook

时间:2014-02-21 07:48:20

标签: python facebook facebook-login python-requests

我试图找到一种在没有使用Python的浏览器的情况下自动登录Facebook的方法。我尝试了"请求"库。试过几种方式:

URL = 'http://m.facebook.com'
requests.get(URL, auth = ('email@domain.com', 'mypassword'))

...

form_data = {'email': 'email@domain.com',
             'pass' : 'mypassword'
            }
requests.post(URL, data = form_data)

...

requests.post(URL + '?email=email@domain.com&pass=mypassword')

最后一种方法填写"电子邮件"页面上的框但是"传递"盒子仍然空着......

有人可以帮帮我吗?是否可以使用请求模拟FB登录?

谢谢!

9 个答案:

答案 0 :(得分:23)

您需要发送完整的表格。找出Facebook期望使用Google Chrome's developer tools之类的内容来监控您的网络请求的最简单方法。

为了让您的生活更轻松,我已经在Facebook上监控自己的登录信息,并在下面复制了它(显然有私人信息被编辑),并删除了不重要的信息:

Request URL:https://m.facebook.com/login.php?refsrc=https%3A%2F%2Fm.facebook.com%2F&refid=8
Request Method:POST

Form Data:
    lsd:AVqAE5Wf
    charset_test:€,´,€,´,水,Д,Є
    version:1
    ajax:0
    width:0
    pxr:0
    gps:0
    m_ts:1392974963
    li:cxwHUxatQiaLv1nZEYPp0aTB
    email:...
    pass:...
    login:Log In

如您所见,表单包含很多字段。所有这些都需要提供以允许您登录。您的代码将提供电子邮件和密码。其余的字段实际上是由Facebook为您提供的HTML设置的值。这意味着,要模拟浏览器登录,您需要执行以下步骤:

  1. 对登录页面(https://m.facebook.com/
  2. 进行GET
  3. 使用HTML解析库(例如BeautifulSoup)来解析HTML并找到表单字段的默认值。
    • 默认值全部位于<input>元素下方的#login_form HTML元素中。您需要按名称查找它们(例如charset_test),然后提取其value属性。
    • 弄清楚如何做到这一点超出了这个答案的范围,所以我不打算进入它。
  4. 将表单字段的默认值与您的电子邮件和密码相结合,如下所示:

    data = {
        'lsd': lsd,
        'charset_test': csettest, 
        'version': version,
        'ajax': ajax,
        'width': width,
        'pxr': pxr,
        'gps': gps,
        'm_ts': mts,
        'li': li,
    }
    data['email'] = email
    data['pass'] = pass
    data['login'] = 'Log In'
    
  5. 使用请求Session发送您的登录信息:

    s = requests.Session()
    r = s.post(url, data=data)
    r.raise_for_status()
    
  6. 通过Session发送您未来的所有HTTP流量。

  7. 正如您所看到的,这是一种非常重要的做事方式。这是因为预计程序不会使用该网站登录:相反,您应该使用他们的SDK或他们的web API

答案 1 :(得分:14)

我也在寻找答案。用requests做这件事很痛苦。所以,我使用了机械化。

import mechanize
browser = mechanize.Browser()
browser.set_handle_robots(False)
cookies = mechanize.CookieJar()
browser.set_cookiejar(cookies)
browser.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41 Safari/534.7')]
browser.set_handle_refresh(False)

url = 'http://www.facebook.com/login.php'
self.browser.open(url)
self.browser.select_form(nr = 0)       #This is login-password form -> nr = number = 0
self.browser.form['email'] = YourLogin
self.browser.form['pass'] = YourPassw
response = self.browser.submit()
print response.read()

有效。 mechanize.browser是模拟浏览器,因此您无需发送所有表单值。它会将它们作为普通浏览器发送,您应该只提供登录名和密码。

祝你好运!

答案 2 :(得分:6)

RoboBrowser这样的库可以让您轻松登录Facebook:

import robobrowser

class Facebook(robobrowser.RoboBrowser):

    url = 'https://facebook.com'

    def __init__(self, email, password):
        self.email = email
        self.password = password
        super().__init__()
        self.login()

    def login(self):
        self.open(self.url)    
        login_form = self.get_form(id='login_form')
        login_form['email'] = self.email
        login_form['pass'] = self.password
        self.submit_form(login_form)

答案 3 :(得分:2)

首先,您需要 ALL 表单数据。你不能只发送用户+通行证,服务器将不允许它。
其次,您需要注意并使用从Facebook收到的cookie才能使其正常工作。

但总而言之,是的,您可以使用request或任何其他图书馆 但我建议改为使用their API

答案 4 :(得分:2)

这是我的工作代码(2017年5月Python 3.6)。为了使它适合您,只需硬编码您自己的USERNAME,PASSWORD和PROTECTED_URL

# https://gist.github.com/UndergroundLabs/fad38205068ffb904685
# this github example said tokens are also necessary, but I found 
# they were not needed
import requests

USERNAME = '-----@yahoo.com'
PASSWORD = '----password'
PROTECTED_URL = 'https://m.facebook.com/groups/318395378171876?view=members'
# my original intentions were to scrape data from the group page
# PROTECTED_URL = 'https://www.facebook.com/groups/318395378171876/members/'
# but the only working login code I found needs to use m.facebook URLs
# which can be found by logging into https://m.facebook.com/login/ and 
# going to the the protected page the same way you would on a desktop

def login(session, email, password):
    '''
    Attempt to login to Facebook. Returns cookies given to a user
    after they successfully log in.
    '''

    # Attempt to login to Facebook
    response = session.post('https://m.facebook.com/login.php', data={
        'email': email,
        'pass': password
    }, allow_redirects=False)

    assert response.status_code == 302
    assert 'c_user' in response.cookies
    return response.cookies

if __name__ == "__main__":

    session = requests.session()
    cookies = login(session, USERNAME, PASSWORD)
    response = session.get(PROTECTED_URL, cookies=cookies, 
allow_redirects=False)
    assert response.text.find('Home') != -1

    # to visually see if you got into the protected page, I recomend copying
    # the value of response.text, pasting it in the HTML input field of
    # http://codebeautify.org/htmlviewer/ and hitting the run button

答案 5 :(得分:1)

我可以说在不使用他们的API的情况下登录Facebook非常烦人。他们也喜欢改变一切,因此维护代码非常重要。

我之前做过这个,但我不认为我的代码能够适应当前的Facebook。但它应该是一个有用的起点:

https://gitorious.org/blogsmashonfb/blogsmashonfb/source/4f7ee94a56fdffe9392485df8999e340f97f4bbe

它有两个部分,一个webcrawler和一个Facebook处理程序(后者是你感兴趣的)。

您的代码中存在的一个主要问题是您必须首先访问Facebook,因为他们会向您发送一个包含您需要发回的隐藏元素的登录表单。

答案 6 :(得分:1)

正如其他人所说的使用请求是一种痛苦。你可以用硒来做到这一点。通过访问他们的网站安装selenium或只是使用pip来安装它。

pip install -U selenium

我写了下面的代码。我自己试了一下它的确有效。

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary

binary = FirefoxBinary(r'C:\Program Files (x86)\Mozilla Firefox\firefox.exe')
driver = webdriver.Firefox(firefox_binary=binary)
driver.get('https://www.facebook.com/')


username= "your_username"
password = "your_password"

UN = driver.find_element_by_id('email')

UN.send_keys(username)

PS = driver.find_element_by_id('pass')

PS.send_keys(password)

LI = driver.find_element_by_id('loginbutton')

LI.click()

答案 7 :(得分:1)

这是有效的(2017年4月)

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import argparse
import datetime
import json
import logging
import re
import random
import requests
import shutil
from pyquery import PyQuery as pq


def main(username, password):

    logging.basicConfig(filename='imgur2fb.log', level=logging.DEBUG)

    session = requests.session()

    uid, dtsg = login(session, username, password)


def login(session, username, password):

    '''
    Login to Facebook
    '''

    # Navigate to the Facebook homepage
    response = session.get('https://facebook.com')

    # Construct the DOM
    dom = pq(response.text)

    # Get the lsd value from the HTML. This is required to make the login request
    lsd = dom('[name="lsd"]').val()

    # Perform the login request
    response = session.post('https://www.facebook.com/login.php?login_attempt=1', data={
        'lsd': lsd,
        'email': username,
        'pass': password,
        'default_persistent': '0',
        'timezone': '-60',
        'lgndim': '',
        'lgnrnd': '',
        'lgnjs': '',
        'locale':'en_GB',
        'qsstamp': ''
    })

    '''
    Get the users ID and fb_dtsg token. The fb_dtsg token is required when making requests as a logged in user. It
    never changes, so we only need to grab this token once.

    If the login was successful a cookie 'c_user' is set by Facebook. If the login failed, the 'c_user' cookie
    will not be present. This will raise an exception.
    '''
    try:
        uid = session.cookies['c_user']
        dtsg = re.search(r'(type="hidden" name="fb_dtsg" value="([0-9a-zA-Z-_:]+)")', response.text).group(1)

        dtsg = dtsg[dtsg.find("value")+6:]
        dtsg = dtsg[1:-1]

    except KeyError:
        raise Exception('Login Failed!')

    return uid, dtsg



try:
    main(username='*****', password='*****')
except Exception, e:
    logging.exception(e)
    print e

答案 8 :(得分:0)

首先,您需要知道要发布的数据。关注this link

获得所有必需数据后,代码很简单,如下所示:

import requests, bs4`    
s = requests.Session()
url = 'https://www.facebook.com/login'

res = s.get(url)
form_data = {
        # Copy paste the form data here as a valid python dict
}
s.post(url, data=form_data)

# Now try accessing your profile from sessions object

这对我有用。