HTTP请求中HTML之前和之后的奇怪字符

时间:2015-04-30 05:02:58

标签: http c++-cx

背景

我正在使用套接字在C ++ / CX中构建自定义HTTP解析器。因此,我可以完全控制整个HTTP请求和响应。

请求

HTTP/1.1 200 OK
Date: Thu, 30 Apr 2015 04:44:59 GMT
Server: Apache
X-Powered-By: PHP/5.2.17
Access-Control-Allow-Origin: *
Cache-Control: public
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html

6a2f
<!DOCTYPE html>
[trimmed document content]
</html>
0

响应

6a2f

附加数据

如果我使用Chrome导航到网页,WireShark会捕获我看到的相同数据(带有无关的字符),但Chrome会设法删除该内容。 (我在开发人员工具的“网络”标签中查看了Chrome的数据。)

我没有在我检索到的每个网站上看到此问题,但问题(如果存在)似乎是整个网站。

问题

  • 文件前后的0<是什么?
  • 这是编码问题吗?
  • 在没有硬编码文档边界的情况下,我是否有某种方式可以肯定地识别,例如它必须以>开头并以{{1}}结尾,实际内容在哪里?
  • 这些字符(如果它们存在于页面中)是否总是分别限制为长度为4和1?

1 个答案:

答案 0 :(得分:1)

这是&#34; chunked transfer encoding&#34;。阅读http://greenbytes.de/tech/webdav/rfc7230.html#chunked.encoding