我在此网站中有一个表单:http://cib.cf.ocha.ac.jp/bitool/MIX/ 我想提交表单并获取结果(我将解析以获取特定内容)在python中,所以我使用urllib和BeautifulSoup(BeautifulSoup中的新手)。我的守则如下:
from bs4 import BeautifulSoup;
import urllib;
import urllib2;
post_parameters = {
'methods':'CF',
'aasequence':'EEEEEEEEEEEEEEEEEEE'
}
post_arguments = urllib.urlencode(post_parameters);
url = 'http://cib.cf.ocha.ac.jp/bitool/MIX/MIX.php';
request = urllib2.Request(url,post_arguments);
#response = urllib.urlopen(url,post_arguments);
response = urllib2.urlopen(request);
the_page = response.read();
soup=BeautifulSoup(the_page);
print soup;
但是当我使用浏览器手动提交表单时,它正在生成的响应中没有pre标签中的内容。文档中的第二个前标记应该有格式化的字符串。
有人能指出错误吗?
答案 0 :(得分:1)
该网站使用复选框可以选择方法,并使用methods[]
名称作为表单元素...将您的post_parameters
更改为:
post_parameters = {
'methods[]':'CF',
'aasequence':'EEEEEEEEEEEEEEEEEEE'
}