拉丁编码字符是否被视为URL安全?

时间:2011-06-10 19:56:36

标签: url friendly-url

拉丁编码字符是否被视为URL安全?

阅读this post后,我发现this document中列出了网页安全字符。但是,如果拉丁编码字符是未保留列表的一部分,则规范不明确。例如:çõ

我不明白为什么这些字符不会包含在非保留列表中。但是,那就是说,我还没有看到任何包含这些字符的网址。

相关问题:假设我可以在网址中使用此类字符,我应该吗?

我的网址将由用户输入生成。我应该保留这些角色的标题,还是替换它们?例如,ç变为c,依此类推。

我的读者的母语是葡萄牙语,但我不确定他们是否会在页面的友好网址中关注这些字符。

1 个答案:

答案 0 :(得分:1)

您提到的链接提到的RFC特别提到ASCII作为URI的字符集:

  

ABNF表示法将其终值定义为非负值      基于US-ASCII编码字符集的整数(代码点)      [ASCII]。

就RFC而言,这会使ASCII以外的字符不安全。

当然,这是IDN存在之前的全部内容。有RFC指定了URL上ASCII和Unicode之间的转换方式。