如何确定.NET HttpClient返回的内容是否为Gzip?

时间:2017-02-02 14:26:34

标签: c# .net gzip dotnet-httpclient

我需要从远程URL下载一些内容,然后确定内容是否已压缩(Gzip或Deflate)。

我的问题是,当您允许HttpClient执行automatic decompression时,它不会在response.Content.Headers.ContentEncoding属性中返回任何值。如果你启用自动解压缩,那么它确实返回ContentEncoding的正确值,但是你留下了一个没有解压缩的Gzip文档,这是没用的。< / p>

请使用以下代码:

var handler = new HttpClientHandler()
{
    AutomaticDecompression = DecompressionMethods.GZip | DecompressionMethods.Deflate
};

using (var client = new HttpClient(handler))
{
    client.DefaultRequestHeaders.Add("accept-encoding", "gzip, deflate");
    client.DefaultRequestHeaders.Add("user-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64)");

    using (var message = new HttpRequestMessage(HttpMethod.Get, new Uri("https://www.twitter.com")))
    {
        using (var response = await client.SendAsync(message))
        {
            if (response.IsSuccessStatusCode)
            {
                string encoding = String.Join(",", response.Content.Headers.ContentEncoding);

                string content = await response.Content.ReadAsStringAsync();
            }
        }
    }
}

HttpClientHandler设置为使用AutomaticDecompression时,内容中的值将成功请求为GZip,然后正确解压缩。但响应头集合中的ContentEncoding值为空。

如果我删除该行:

AutomaticDecompression = DecompressionMethods.GZip | DecompressionMethods.Deflate

然后我确实得到了正确的ContentEncoding值(“gzip”),但是文档以原始压缩格式返回,这是不行的。

那么有没有办法获得有时(但不总是)GZip的内容,并在内容时自动解压缩,但后来又知道它最初是作为Gzip发送的?

1 个答案:

答案 0 :(得分:1)

不是一个完整的答案,但我浏览了HttpClient的源代码,这使我得到了基础HttpResponse的代码。在那里,你会发现这个金块:

  if ((decompressionMethod & DecompressionMethods.GZip) != DecompressionMethods.None && str.IndexOf("gzip", StringComparison.CurrentCulture) != -1)
  {
    this.m_ConnectStream = (Stream) new GZipWrapperStream(this.m_ConnectStream, CompressionMode.Decompress);
    this.m_ContentLength = -1L;
    this.m_HttpResponseHeaders["Content-Encoding"] = (string) null;
  }

正如您所看到的,在最后一行,他们完全删除了该标题。我不完全确定为什么这就是他们决定做的事情,但事实就是如此。

我想您的选择是自己解压缩,或者发出两个请求(两者都不是很好的选择)。