HTTP请求中HTML之前和之后的奇怪字符

时间：2015-04-30 05:02:58

标签： http c++-cx

背景

我正在使用套接字在C ++ / CX中构建自定义HTTP解析器。因此，我可以完全控制整个HTTP请求和响应。

请求

HTTP/1.1 200 OK
Date: Thu, 30 Apr 2015 04:44:59 GMT
Server: Apache
X-Powered-By: PHP/5.2.17
Access-Control-Allow-Origin: *
Cache-Control: public
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html

6a2f
<!DOCTYPE html>
[trimmed document content]
</html>
0

响应

6a2f

附加数据

如果我使用Chrome导航到网页，WireShark会捕获我看到的相同数据（带有无关的字符），但Chrome会设法删除该内容。（我在开发人员工具的“网络”标签中查看了Chrome的数据。）

我没有在我检索到的每个网站上看到此问题，但问题（如果存在）似乎是整个网站。

问题

文件前后的0和<是什么？
这是编码问题吗？
在没有硬编码文档边界的情况下，我是否有某种方式可以肯定地识别，例如它必须以>开头并以{{1}}结尾，实际内容在哪里？
这些字符（如果它们存在于页面中）是否总是分别限制为长度为4和1？

1 个答案:

答案 0 :(得分：1)

这是＆＃34; chunked transfer encoding＆＃34;。阅读http://greenbytes.de/tech/webdav/rfc7230.html#chunked.encoding。