剪辑期间的网址变化糊

时间:2018-03-27 19:16:42

标签: url unicode idn

我刚遇到一些我不太懂的东西。我收到了一份包含网址的文件(我的雇主的行政备忘录)。地址不是可点击的超链接,只是文本。

有趣的是,当地址是复制&粘贴到Web浏览器地址栏中,它会导致Web浏览器尝试联系不同于剪切&粘贴的文字包含。地址文本最初似乎正确地粘贴到地址栏中,直到我点击输入 - 然后文本立即变为其他内容。

请注意,这不是简单的网站重定向问题。我知道这是因为如果我手动输入相同的地址(而不是从原始文档中复制和粘贴),则会加载“正确”的地址。只有在复制/粘贴/加载过程之后,文本似乎才会神奇地改变。

我也注意到如果我复制&首先将地址粘贴到记事本文本文件中,保存文本文件,关闭,重新打开,然后复制/粘贴到Web浏览器,然后加载“正确”的站点。值得注意的是,当我保存时,Notepad警告说有一些Unicode格式的字符会丢失。所以我假设有一些隐藏的unicode文本在我保存为纯文本时被删除。

但是,在记事本中,如果我启用“显示Unicode控制字符”选项,我什么也看不见。那么可能会发生什么?

要真正具体,域名转换如下:http://www.aaaaaaaaaa-usa.com/bbbbb/ddddddtools.html ==> www.xn--aaaaaaaaaausa-km6g.com。 (浏览器当然报告它找不到服务器的IP地址)

1 个答案:

答案 0 :(得分:0)

为了兼容性,域名应该是ASCII文本,因此有一个标准(IDN)可以将其他字符转换为ASCII,使用两个字母前缀后跟两个短划线--

另外,有一些网络钓鱼攻击,使用其他字母表上的字母,看起来像拉丁字母,所以欺骗用户。因此,某些浏览器选择显示ascii名称而不是目标名称。 (它从浏览器更改为浏览器,通常仅在选定的相似字符上更改。)