通过Guzzle连接到未知方案的站点

时间:2017-05-31 15:42:36

标签: php curl guzzle guzzle6 guzzlehttp

我有一个没有指定方案的URL列表,例如:

  • github.com(仅适用于https);
  • what.ever(仅适用于http);
  • google.com(支持两种方案)。

我需要使用Guzzle(v6)获取其根路径(/)的内容,但我不知道他们的方案:httphttps

我可以在不提出2个请求的情况下解决我的任务吗?

2 个答案:

答案 0 :(得分:0)

Guzzle默认会遵循重定向,所以除非您有明确的https列表,否则我会在缺少的情况下添加http,如果只接受https请求,则允许网站重定向(这就是他们的意思应该这样做。

<?php

require 'vendor/autoload.php';

use GuzzleHttp\Client;

$response = (new Client)->get('http://github.com/', ['debug' => true]);

响应:

> GET / HTTP/1.1
Host: github.com
User-Agent: GuzzleHttp/6.2.1 curl/7.51.0 PHP/5.6.30

< HTTP/1.1 301 Moved Permanently
< Content-length: 0
< Location: https://github.com/
< Connection: close
<
* Curl_http_done: called premature == 0
* Closing connection 0
*   Trying 192.30.253.112...
* TCP_NODELAY set
* Connected to github.com (192.30.253.112) port 443 (#1)
* TLS 1.2 connection using TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256
* Server certificate: github.com
* Server certificate: DigiCert SHA2 Extended Validation Server CA
* Server certificate: DigiCert High Assurance EV Root CA
> GET / HTTP/1.1
Host: github.com
User-Agent: GuzzleHttp/6.2.1 curl/7.51.0 PHP/5.6.30

< HTTP/1.1 200 OK
< Server: GitHub.com
< Date: Wed, 31 May 2017 15:46:59 GMT
< Content-Type: text/html; charset=utf-8
< Transfer-Encoding: chunked
< Status: 200 OK

答案 1 :(得分:0)

一般情况下 - 不,没有两个请求就无法解决问题(因为一个请求可能没有重定向)。

您可以使用Guzzle执行2次异步请求,然后您可能需要花费相同的时间,但需要使用适当的通用解决方案。

只需创建两个请求并等待两者:

 $httpResponsePromise = $client->getAsync('http://' . $url);
 $httpsResponsePromise = $client->getAsync('https://' . $url);

 list($httpResponse, $httpsResponse) = \GuzzleHttp\Promise\all(
     [$httpResponsePromise, $httpsResponsePromise]
 );

就是这样,现在你有两个响应(对于每个协议),你可以并行完成它们。