HTTP标头中的非法字符

时间:2013-09-26 12:18:39

标签: java http http-headers

我正在创建HttpUrlConnection,需要设置多个自定义标头。

我想按照以下方式执行某些操作,但标题映射的内容需要来自单个字符串。在HTTP标头名称和HTTP标头值中是否存在任何非法或极少使用的字符?

HashMap<String, String> headers = new HashMap<String, String>();

// TODO: How can I fill the headers map reliably from a single string?

HttpURLConnection c = (HttpURLConnection) url.openConnection();
for(Map.Entry<String, String> e : headers.entrySet())
    c.setRequestProperty(e.getKey(), e.getValue());

现在的解决方案

似乎任何HTTP标头名称都不包含任何空格(通常使用破折号?),因此我可以使用单个空格将名称与值分开。至于名称 - 值集,似乎我搞砸了,因为根据给定的答案,值可以包含几乎任何东西。所以我刚刚选择了一个很可能永远不会被使用的角色:§。如果事实证明它确实需要,我只需要调整我的代码:p

Header1 Value1§Header2 Value2§Header3 Header3

1 个答案:

答案 0 :(得分:14)

来自RFC7230的相关BNF是:

field-name = token

token = 1*tchar

tchar = "!" / "#" / "$" / "%" / "&" / "'" / "*" / "+" / "-" / 
        "." / "^" / "_" / "`" / "|" / "~" / DIGIT / ALPHA

字符集可见USASCII。

RFC 7230比您的问题更新,但在相关细节中,它并没有改变RFC 2616之前所说的内容。

对于字段名称有一个非常强的约定,它比RFC允许的限制性更强,并且在各种实现中强制执行不同程度。字段名称通常遵循[ASCII / NUMERAL]字序列的模式,每个字的首字母(仅)大写。单词用单个连字符分隔。

所以,例如&#34; HttpUrlConnection&#34;应该是一个HTTP头名称(而不是一个java令牌),你可以称之为“Http-Url-Connection&#39;。

我朦胧地记得曾经跟踪过一个错误,一些实施严格到不允许在一个单词中承认多个大写字母(这恰好是一个缩写词)。即非常严格地遵循这种更受限制的格式是值得的。

  • 非ASCII字符集不会在字段名称中起作用,但可以在字段值中使用。

  • 标准不支持在字段名称中转义。逃避值不是HTTP或MIME标准的关注点,但您可以选择重用标准URL编码方法来编码一组名称值对。