网页中的python自动填充表单

时间:2017-08-10 06:56:14

标签: python html forms webpage mechanize

我正在尝试在一个网页中填写一个表单,该表单有一个文本框和一个发送按钮,html看起来像这样

<form class="form-horizontal">
                        <div class="row">
                            <div class="col-md-12">
                                <div id="TextContainer" class="textarea-container">
                                    <textarea id="Text" rows="5" maxlength="700" class="form-control remove-border" style="background:none;"></textarea>
                                </div><button id="Send" class="btn btn-primary-outline" type="button" onclick="SendMessage()" style="margin-top:10px" data-loading-text="Loading..."><span class="icon icon-pencil"></span> Send</button>
                            </div>
                        </div>
                    </form>

我尝试使用mechanize来提交带有此代码的表单

import re
from mechanize import Browser

br = Browser()
response=br.open("https://abcd.com/")
for f in br.forms():
    if f.attrs['class'] == 'form-horizontal':
        br.form = f
text = br.form.find_control(id="Text")
text.value = "something"
br.submit()

代码运行没有错误,但没有提交,我该怎么做?

这是SendMessage函数

function SendMessage() {
    var text = $('#Text').val();
    var userId = $('#RecipientId').val();
    if (text.trim() === "")
    {
        $('#TextContainer').css('border-color', 'red');
    }
    else if (new RegExp("([a-zA-Z0-9]+://)?([a-zA-Z0-9_]+:[a-zA-Z0-9_]+@)?([a-zA-Z0-9.-]+\\.[A-Za-z]{2,4})(:[0-9]+)?(/.*)?").test(text))
    {
        $('#TextContainer').css('border-color', 'red');
        $('#message').html("Links are not allowed in messages");
    }
    else
    {
        $('#Send').button('loading');
        $.ajax(
        {
            url: '/Messages/SendMessage',
            type: 'POST',
            cache: false,
            data:
            {
                __RequestVerificationToken: $('<input name="__RequestVerificationToken" type="hidden" value="CfDJ8MQSRebrM95Pv2f7WNJmKQWGnVR66zie_VVqFsquOCZLDuYRRBPP1yzk_755VDntlD3u0L3P-YYR0-Aqqh1qIjd09HrBg8GNiN_AU48MMlrOtUKDyJyYCJrD918coQPG0dmgkLR3W85gV6P4zObdEMw" />').attr('value'),
                userId: userId,
                text: text
            }

        });
    }

}

2 个答案:

答案 0 :(得分:1)

我怀疑问题是HTML表单中的提交按钮不是type=submit - 所以当您致电br.submit()时,机械师不会知道该怎么做。修复方法是更改​​HTML网站上的按钮类型,或告诉浏览器使用哪个按钮提交表单:

br.submit(type='button', id='Send')

submit方法采用与HTML Forms API相同的参数,因此我建议您查看documentation以获取更多详细信息。

<强>更新

这里的问题似乎是附加到按钮的JavaScript方法。 Mechanize不支持调用JavaScript函数,因此您将无法使用.submit()方法提交表单。相反,最好的选择可能是阅读SendMessage() JavaScript函数,如果有人单击“发送”按钮,则会调用该函数,并手动将其转换为Python。在最好的情况下,它包含一个简单的AJAX POST请求,在Python中很容易实现。请look here提供相关问题。

第二次更新

鉴于您的问题中的新信息,特别是JavaScript函数,您现在可以在Python脚本中手动实现POST请求。我建议使用Requests模块,这将使实现更容易。

import requests

data = {
    "__RequestVerificationToken": "CfDJ8MQSRebrM95Pv2f7WNJmKQWGnVR66zie_VVqFsquOCZLDuYRRBPP1yzk_755VDntlD3u0L3P-YYR0-Aqqh1qIjd09HrBg8GNiN_AU48MMlrOtUKDyJyYCJrD918coQPG0dmgkLR3W85gV6P4zObdEMw",
    "userId": "something",
    "text": "something else"
}

response = requests.post("https://example.com/Messages/SendMessage", data=data)

response现在将包含您可以用来检查请求是否成功完成的响应。请注意,您可能需要使用mechanize读出__RequestVerificationToken,因为我怀疑每次打开网站时都会生成它。您可以使用html_source = br.read()读取HTML源代码,然后搜索__RequestVerificationToken并尝试提取相应的值。

答案 1 :(得分:0)

您可以将名称属性赋予文本区域,例如:

<form class="form-horizontal">
                        <div class="row">
                            <div class="col-md-12">
                                <div id="TextContainer" class="textarea-container">
                                    <textarea id="Text" name="sometext" rows="5" maxlength="700" class="form-control remove-border" style="background:none;"></textarea>
                                </div><button id="Send" class="btn btn-primary-outline" type="button" onclick="SendMessage()" style="margin-top:10px" data-loading-text="Loading..."><span class="icon icon-pencil"></span> Send</button>
                            </div>
                        </div>
                    </form>

然后尝试一下:

import re
from mechanize import Browser

br = mechanize.Browser()
br.open("https://abcd.com/")
br.select_form(nr=0) #in case of just single form you can select form passing nr=0
br["sometext"] = "something"
response  = br.submit()
print(response.read())

如果成功提交表单,那么您可以阅读回复正文。