我试图获取wordpress帖子的来源,然后查看源代码并获取特定的文本字符串,让我们说出帖子日期。我使用tor作为wordpress博客被阻止在我的最后。现在它没有显示任何错误,也没有在终端显示任何内容。它是一个有效的网站,并没有阻止Tor或类似的东西。在终端或PHP的错误日志中没有显示错误,并且我已经用尽地方寻找错误,任何人都知道为什么要这样做? Curl在另一个实例中正常工作以正确获取网站源。 (此外,变量tport是此机器上的正确端口,9150)
$url = 'http://subdomain.domain.com/2015/02/01/page/'; $ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_PROXY, "udp://127.0.0.1:$tport/");
curl_setopt($ch, CURLOPT_PROXYTYPE, 7);
curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS5);
$output = curl_exec($ch); echo $output;
echo curl_error($ch); curl_close($ch);
编辑:标题信息。什么使它成为一个糟糕的要求?
* Connected to 127.0.0.1 (127.0.0.1) port 9150 (#1)
HTTP/1.115/02/01/page/
Host: subdomain.domain.com
Accept: */*
< HTTP/1.1 400 Bad Request
* Server nginx is not blacklisted
< Server: nginx
< Date: Wed, 05 Aug 2015 22:44:12 GMT
< Content-Type: text/html
< Content-Length: 1245
< Connection: close
< ETag: "53f497d2-4dd"
< X-ac: 1.fra _dca
<
* Closing connection 1
Connected to host successfully