python mechanize javascript提交按钮问题!

时间:2010-09-26 15:50:09

标签: python mechanize urlopen

使用mechanize.browser模块创建一些脚本。

其中一个问题是所有其他问题都可以,但是当提交()表单时,它不起作用,

所以我发现了一些怀疑来源部分。

在html源代码中我发现了如下内容。

我在思考,loginCheck(this)在提交表单时出现问题。

但如何使用mechanize模块处理这种javascript函数,所以我可以

成功提交表格并可以收到结果吗?

以下是与loginCheck(this)javascript函数相关的websource片段。

        function init(){
        FRMLOGIN.ID.focus();
    }

    function loginCheck(f){
        if(chkNull(f.ID, "아이디를"))
            return false;

        if(chkNull(f.PWD, "패스워드를"))
            return false;

        //f.target = "ifrmLoginHidden";
        f.action = (f.SECCHK.checked) ? "https://user.buddybuddy.co.kr/Login/Login.asp" : "http://user.buddybuddy.co.kr/Login/Login.asp";
    }

我知道机械化不支持javascript,所以我想通过progammatically loginCheck()

使用python机械化代码。

任何人都会帮助我将这个javascript函数改为python mechanize

翻译代码?

如此正确可以登录网站?

如果非常欣赏!

    # -*- coding: cp949-*-
import sys,os
import mechanize, urllib
import cookielib
from BeautifulSoup import BeautifulSoup,BeautifulStoneSoup,Tag
import datetime, time, socket
import re,sys,os,mechanize,urllib,time


br = mechanize.Browser()
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)

# Browser options
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)

# Follows refresh 0 but not hangs on refresh > 0
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

# Want debugging messages?
br.set_debug_http(True)
br.set_debug_redirects(True)
br.set_debug_responses(True)

# User-Agent (this is cheating, ok?)
br.addheaders = [('User-agent', 'Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.6')]
br.open('http://user.buddybuddy.co.kr/Login/LoginForm.asp?URL=')
html = br.response().read()
print html

br.select_form(name='FRMLOGIN')
print br.viewing_html()
br.form['ID']='psh7943'
br.form['PWD']='qkrthgus'
br.submit()

print br.response().read()

如果有人能帮助我..很欣赏!!

1 个答案:

答案 0 :(得分:4)

您可以在浏览器中手动完成登录过程并检查(使用Firefox中的Firebug,Chrome中的开发者工具等),当您点击“确定”按钮时,会向网站发送哪些请求。通常这是一个POST请求,其中包含从登录表单中获取的数据。检查此请求中发送的数据,并执行您自己的发布请求:

mechanize.urlopen(URL, POST_DATA). 

您可以使用:

从mechanize的表单对象中提取POST_DATA(和post_url)
form.click_request_data()

但您可能需要做一些修改。

很简单的例子:

br.select_form(name='form_name')
br.form['login']='login'
br.form['pass']='pass'
post_url, post_data, headers =  br.form.click_request_data()
mechanize.urlopen(post_url, post_data)