我尝试从pycurl网站获取数据。 我之前在php(也使用curl)中创建了一个类似的脚本,但是在python中我得到了空响应。 类似的问题是与PHP - 网站采取发布数据,初始化会话和重定向到结果页面,但如果没有cookie允许它返回空响应而不是重定向。我无权访问此网站上的代码。使用COOKIEFILE和COOKIEJAR选项解决了这个问题。 这是php代码:
<?php
$anul = 2009;
$idnp = "2000000000000";
$seria_diploma = "AB000000000";
$url = "http://acte.edu.md/handler.php";
$cookie_file = tempnam("tmp", "cookie");
$curl_session = curl_init($url);
curl_setopt($curl_session, CURLOPT_POST, 1);
$post_fields = "an=$anul&idnp=$idnp&=$seria_diploma&Submit=OK";
curl_setopt($curl_session, CURLOPT_POSTFIELDS,$post_fields);
curl_setopt($curl_session, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($curl_session, CURLOPT_COOKIEFILE, $cookie_file);
curl_setopt($curl_session, CURLOPT_COOKIEJAR, $cookie_file);
curl_setopt($curl_session, CURLOPT_RETURNTRANSFER, true);
$result = curl_exec($curl_session);
curl_close($curl_session);
echo $result;
在python中使用相同的选项我得到HTTP代码200而不是302的空响应。 这是我使用的代码:
url = "http://acte.edu.md/handler.php"
post_data = dict({
"an":2009,
"idnp":"2000000000000",
"a":"AB000000000",
"Submit":"OK"
})
buf = StringIO.StringIO()
c = pycurl.Curl()
c.setopt(pycurl.URL,url)
c.setopt(pycurl.WRITEFUNCTION, buf.write)
#c.setopt(pycurl.CONNECTTIMEOUT,10000)
cookiefile = os.tempnam(_APP_ROOT_PATH+"temp_files","cookie")
c.setopt(pycurl.COOKIEFILE, cookiefile)
c.setopt(pycurl.COOKIEJAR, cookiefile)
c.setopt(pycurl.FOLLOWLOCATION, 1)
#c.setopt(pycurl.MAXREDIRS, 5)
c.setopt(pycurl.POST, 1)
c.setopt(pycurl.POSTFIELDS, urllib.urlencode(post_data))
c.setopt(pycurl.VERBOSE, True)
c.perform()
response += "ERROR:" + c.errstr()
response += c.getinfo(pycurl.HTTP_CODE).__str__()+ c.getinfo(pycurl.EFFECTIVE_URL)
c.close()
请告诉我你是否有任何建议......
答案 0 :(得分:0)
问题在于无效的POST参数。如果他们没有通过验证页面返回空响应。