我打算使用twill在一个页面上填写表单,点击提交按钮,然后使用BeautifulSoup解析生成的页面。如何向BeautifulSoup提供HTML页面?我假设我必须阅读当前的网址,但我不知道如何实际返回网址以便这样做。我试过twill的TwillBrowser.get_url(),但它只返回None。
答案 0 :(得分:0)
对于任何未来的患者,我发现使用机械而不是斜纹更好运,因为斜纹是机械化的未更新的薄壳。解决方案如下:
import mechanize
url = "foo.com"
br = mechanize.Browser()
br.open(url)
br.select_form(name = "YOURFORMNAMEHERE") #make sure to leave the quotation marks
br["YOURINPUTFIELDNAMEHERE"] = ["YOURVALUEHERE"] #this must be in a list even if it is only one value
response = br.submit()
print response.geturl()
答案 1 :(得分:0)
终于搞清楚了!
如果您像这样导入斜纹:
import twill.commands as com
然后是url =
url = com.browser.get_url()