使用mechanize和Python提交表单

时间:2012-06-21 16:36:48

标签: python screen-scraping mechanize www-mechanize

我正在尝试废弃一个需要提交两个表单的网站:第一个用于登录,第二个用于指定我的研究。 我正在使用Python和机械化包。

第一个没问题,但我无法弄清楚如何通过第二个。

以下是我的代码中与上述公司相关的部分

agemin=18
agemax=25
by='region'
country='France'
region=2
newcustomers=1

browser.select_form(nr=0)
browser['age[min]']=agemin
browser['age[max]']=agemax
browser['country']=country
browser['region']=region
browser['by']=by
browser['new-customers']=newcustomers

response=browser.submit()
content=response.read()

但是当我通过示例提交变量'age [min]'时,我收到以下错误消息:

TypeError: object of type 'int' has no len()

为您提供更多信息,以下是'print br.form'

的内容
<POST http://www.adopteunmec.com/qsearch/ajax_quick application/x-www-form-urlencoded
  <SelectControl(age[min]=[, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, *30, 31,         32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54,   55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])>
  <SelectControl(age[max]=[, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, *45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])>
  <SelectControl(by=[*region, distance])>
  <SelectControl(country=[*fr, be, ch, ca])>
  <SelectControl(region=[*1, 2, 3, 4, 5, 6, 7, 8, 22, 23, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 11])>
  <SelectControl(distance[min]=[*, 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 610, 620, 630, 640, 650, 660, 670, 680, 690, 700, 710, 720, 730, 740, 750, 760, 770, 780, 790, 800, 810, 820, 830, 840, 850, 860, 870, 880, 890, 900, 910, 920, 930, 940, 950, 960, 970, 980, 990, 1000])>
  <SelectControl(distance[max]=[, 0, 10, 20, 30, 40, 50, 60, 70, *80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 610, 620, 630, 640, 650, 660, 670, 680, 690, 700, 710, 720, 730, 740, 750, 760, 770, 780, 790, 800, 810, 820, 830, 840, 850, 860, 870, 880, 890, 900, 910, 920, 930, 940, 950, 960, 970, 980, 990, 1000])>
  <CheckboxControl(new=[*1])>>

我的猜测是表单需要一个包含所有变量的对象(如列表)来接受它;这就是为什么它拒绝一个接一个地提交的变量。

提前感谢您的帮助!

亚历

1 个答案:

答案 0 :(得分:1)

agemin应为字符串,或者转换为字符串

此外,表单选择控件的值的setter需要一个列表。

所以,

agemin="25"

browser['age[min]']=[agemin]

或只是

agemin=25           #as you did
browser['age[min]']=[str(agemin)]