RFC 3986 URI: Generic Syntax规范将分号列为保留(sub-delim)字符:
reserved = gen-delims / sub-delims
gen-delims = ":" / "/" / "?" / "#" / "[" / "]" / "@"
sub-delims = "!" / "$" / "&" / "'" / "(" / ")"
/ "*" / "+" / "," / ";" / "="
“;”的保留目的是什么? URI中的分号?就此而言,其他子delim的目的是什么(我只知道“&”,“+”和“=”的目的)?
答案 0 :(得分:35)
第3.3节末尾有一个解释。
除了点数段 分层路径,路径段 通用认为不透明 句法。 URI生成应用程序 经常使用保留字符 允许在一个细分中划分 特定计划或 取消引用处理程序,具体 子。例如, 分号(“;”)和等号(“=”) 经常使用保留字符 划分参数和参数 适用于该细分的价值。 逗号(“,”)保留字符是 经常用于类似目的。 例如,一个URI生成器可能 使用诸如“name; v = 1.1”之类的段 表示对1.1版的引用 “名字”,而另一个可能 使用诸如“name,1.1”之类的段 表示相同。参数类型 可以通过特定方案来定义 语义,但在大多数情况下 参数的语法特定于 URI的实现 解除引用算法。
换句话说,它是保留的,以便想要URL中某些分隔列表的人可以安全地使用;
作为分隔符,即使部分包含;
,只要内容是百分比编码的。换句话说,你可以这样做:
foo;bar;baz%3bqux
并将其解释为三个部分:foo
,bar
,baz;qux
。如果分号不是保留字符,则;
和%3b
将是等效的,因此URI将被错误地解释为四个部分:foo
,bar
,{{ 1}},baz
。
答案 1 :(得分:7)
如果你回到规范的older versions,意图会更清楚:
path_segments = segment *( "/" segment )
segment = *pchar *( ";" param )
每个路径段可以包括a 参数序列,由分号“;”表示字符。
我相信它起源于FTP URI s。
答案 2 :(得分:5)
Section 3.3 covers this - 这是一个不透明的分隔符,如果方便的话,URI生成的应用程序可以使用:
除了点数段 分层路径,路径段 通用认为不透明 句法。 URI生成应用程序 经常使用保留字符 允许在一个细分中划分 特定计划或 取消引用处理程序,具体 子。例如, 分号(“;”)和等号(“=”) 保留字符经常用于 分隔参数和参数 适用于该细分的价值。该 逗号(“,”)保留字符是 经常用于类似目的。对于 例如,一个URI生成器可能使用a 段如“name; v = 1.1”到 表示对1.1版本的引用 “名字”,而另一个可能使用 段如“名称,1.1”表示 相同。参数类型可以是 由特定于方案的语义定义, 但在大多数情况下,a的语法 参数是特定的 URI的实现 解除引用算法。
答案 3 :(得分:4)
目前的使用范围有一些有趣的约定。这些说到何时使用分号或逗号。从“RESTful Web Services”一书中可以看出:
使用标点符号在同一层次结构中分隔多个数据。当项目的顺序很重要时使用逗号,...当订单无关紧要时使用分号。
答案 4 :(得分:2)
自2014年以来,已知路径段对Reflected File Download attacks有贡献。我们假设我们有一个易受攻击的API,它反映了我们发送给它的任何内容(网址显然是真实的,现在已修复):
https://google.com/s?q=rfd%22||calc||
{"results":["q", "rfd\"||calc||","I love rfd"]}
现在,这在浏览器中是无害的,因为它的JSON不会被渲染,但浏览器宁愿将响应下载为文件。现在,路径段为攻击者提供了帮助:
https://google.com/s;/setup.bat;?q=rfd%22||calc||
分号(;/setup.bat;
)之间的所有内容都将不发送到Web服务,而是浏览器会将其解释为文件名...以保存API响应。现在,将下载并运行名为setup.bat
的文件,而不会询问运行从Internet下载的文件的危险(因为它的名称中包含单词"setup"
)。内容将被解释为Windows批处理文件,并将运行calc.exe
命令。
预防:
Content-Disposition: attachment; filename="whatever.txt"
;谷歌错过了实际使攻击更容易的filename
部分X-Content-Type-Options: nosniff
标头答案 5 :(得分:0)
我发现了以下用例:
它是HTML实体的最终字符:
https://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
在HTML或XML中使用其中一个字符实体引用 文件,输入&符号,后跟实体名称和a 分号,例如&对于&符号("&")。
Apache Tomcat 7(或更新的版本?!)将其标记为path parameter
:
https://superevr.com/blog/2011/three-semicolon-vulnerabilities
Apache Tomcat是支持" Path的Web服务器的一个示例 参数&#34 ;.路径参数是文件名后的额外内容, 用分号分隔。分号后的任意内容 不会影响Web浏览器的登录页面。这意味着 http://example.com/index.jsp;derp仍将返回index.jsp,而不是 一些错误页面。
URI方案将MIME和数据拆分为:
https://en.wikipedia.org/wiki/Data_URI_scheme
它可以包含一个可选的字符集参数,与之分开 前面的部分用分号(;)。
<img src=" AAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO 9TXL0Y4OHwAAAABJRU5ErkJggg==" alt="Red dot" />
IIS5和IIS6中存在一个错误,可以绕过文件上传限制:
https://www.owasp.org/index.php/Unrestricted_File_Upload
将文件扩展名列入黑名单可以绕过以下保护:... 通过在禁止扩展名后添加分号字符和 在允许的之前(例如&#34; file.asp; .jpg&#34;)
<强>结论:强>
不要在URL中使用分号,否则它们可能会意外地产生HTML实体或URI方案。