在Mechanize

时间:2015-06-03 09:42:24

标签: python web-scraping mechanize

我正在废弃网站来分析其中的每个表单,以找到一个允许我自动向这些网站提交搜索查询的一般模式。到目前为止,许多表单的名称要么不存在,要么不清楚,因此我需要废弃相关标签以获得控件(字段)的含义。

Mechanize support site表示在搜索特定标签时可以从网页中的表单中提取控件:

control = form.find_control(label="select a cheese")

我正在寻找从控件中获取标签的解决方案。 Mechanize的文档很差but the answer to this question提供了更详细文档的链接,但我无法在那里找到答案。

是否有人设法执行此操作或找到解决方法?

1 个答案:

答案 0 :(得分:0)

在将数据提交自动化到表单时,我曾经做过类似的事情。我获得了控件的名称和标签列表:

names = []    
labels = []     
for c in br.form.controls.__iter__():
    names.append(c.name)
    labels.append(c._label)

使用这些列表,您可以选择一个表单:

control = form.find_control(name=names[0])