链接奇怪的Unicode

时间:2015-10-10 16:35:01

标签: html unicode

我有一个链接,当我复制粘贴时会更改。复制的网址是

https://www.webteb.com/tests/search?Text=الدم

粘贴的

https://www.webteb.com/tests/search?Text=%20%D8%A7%D9%84%D8%AF%D9%85

正如您所看到的,الدم这个词已转换为%20%D8%A7%D9%84%D8%AF%D9%85

这是怎么发生的?什么是unicoding类型?我怎么能理解它? 我尝试过很多方面,但我还是初学者,所以我找不到任何好的方法。

1 个答案:

答案 0 :(得分:2)

你所拥有的是首先编码为UTF-8的Unicode文本,然后是使用URL编码编码的每个字节。

URL编码用百分号(%)和两个十六进制数字替换每个字节。

有关详细信息,请参阅https://en.wikipedia.org/wiki/Percent-encoding

快速举例:

  • %20对单个字节进行编码,对于U + 0020(空格,)为UTF-8。
  • %D8%A7对两个字节(D8 A7)进行编码,对于U + 0627(ARABIC LETTER ALEF,ا)为UTF-8。
  • %D9%84对两个字节进行编码(D9 84),对于U + 0644(ARABIC LETTER LAM,ل)为UTF-8。