我们如何使用Qt / C ++解析HTTP响应头字段?

时间:2012-06-05 07:49:34

标签: c++ qt parsing http-headers kde

我正在编写一个使用Qt / KDE库的软件。目标是将HTTP标头响应字段解析为结构的不同字段。到目前为止,HTTP头响应包含在QString中。

它看起来像这样:

"HTTP/1.1 302 Found
date: Tue, 05 Jun 2012 07:40:16 GMT
server: Apache/2.2.22 (Linux/SUSE)
x-prefix: 49.244.80.0/21
x-as: 23752
x-mirrorbrain-mirror: mirror.averse.net
x-mirrorbrain-realm: region
link: <http://download.services.openoffice.org/files/du.list.meta4>; rel=describedby; type="application/metalink4+xml"
link: <http://download.services.openoffice.org/files/du.list.torrent>; rel=describedby; type="application/x-bittorrent"
link: <http://mirror.averse.net/openoffice/du.list>; rel=duplicate; pri=1; geo=sg
link: <http://ftp.isu.edu.tw/pub/OpenOffice/du.list>; rel=duplicate; pri=2; geo=tw
link: <http://ftp.twaren.net/OpenOffice/du.list>; rel=duplicate; pri=3; geo=tw
link: <http://mirror.yongbok.net/openoffice/du.list>; rel=duplicate; pri=4; geo=kr
link: <http://ftp.kaist.ac.kr/openoffice/du.list>; rel=duplicate; pri=5; geo=kr
digest: MD5=b+zfBEizuD8eXZUTWJ47xg==
digest: SHA=A5zw6PkywlhiPlFfjca+gqIGLHA=
digest: SHA-256=HOrd0MMBzS8Ctljpe4PauwStijsnBKaa3gXO4L30eiA=
location: http://mirror.averse.net/openoffice/du.list
content-length: 329
connection: close
content-type: text/html; charset=iso-8859-1" 

除自定义字段外,标题响应中可能还有更多字段。 我想出的唯一可行方法是手动搜索“链接”,“摘要”等字段,并创建一个字段为键的QMap。但是,我想必须有更好的方法来做到这一点。如果你能帮助我,我会感激你的。

1 个答案:

答案 0 :(得分:5)

HTTP标头最初应该在QByteArray中(因为它是ASCII,而不是UTF-16),但该方法与QString相同:

  • 逐行拆分标题
  • 将每一行拆分为冒号字符
  • 在存储它们之前修剪2个结果字符串周围的任何空格(常规空格和'\r'个字符)。
QByteArray httpHeaders = ...;
QMap<QByteArray, QByteArray> headers;

// Discard the first line
httpHeaders = httpHeaders.mid(httpHeaders.indexOf('\n') + 1).trimmed();

foreach(QByteArray line, httpHeaders.split('\n')) {
    int colon = line.indexOf(':');
    QByteArray headerName = line.left(colon).trimmed();
    QByteArray headerValue = line.mid(colon + 1).trimmed();

    headers.insertMulti(headerName, headerValue);
}